Latest · December 4, 2021 0

A câmera Clipes do Google oferece um instantâneo do que está por vir

O Google realizou um grande evento de hardware esta semana, anunciando alguns novos smartphones da marca Pixel, dois dispositivos Google Home, um novo laptop Pixelbook, novos fones de ouvido chamados Pixel Buds e uma câmera para consumidores chamada Google Clips.

De todos os novos produtos Google anunciados, o Google Clips é de longe o mais interessante, o que quer dizer que representa a tendência mais interessante. Este dispositivo de consumidor representa o futuro da IA ​​corporativa

Mas espere, você pode dizer. Não é o produto Pixel Buds do Google o mais revolucionário? Sua capacidade de traduzir idiomas em tempo real é algo saído da ficção científica, e a eliminação das barreiras linguísticas certamente tem implicações importantes para o futuro da humanidade.

Tudo isso é meio que verdade. Muitas empresas (incluindo o Google) têm desenvolvido software de tradução de idiomas em tempo real e disponibilizado rapidamente para smartphones. O Google Translate é incrível, e eu o uso há anos enquanto viajo ao redor do mundo.

A única inovação de tradução nos Pixel Buds é que os fones de ouvido têm alto-falantes externos, voltados para fora, além dos voltados para dentro, e as traduções de saída são reproduzidas por esses alto-falantes, enquanto as traduções de entrada são reproduzidas pelos alto-falantes normais dos fones de ouvido.

Em outras palavras, Pixel Buds simplesmente reproduz o áudio do Google Translate, mas escolhendo de forma inteligente entre dois conjuntos de alto-falantes para reprodução.

O efeito é alucinante, mas a “inovação” da seleção de alto-falantes … nem tanto.

O Google Clips, por outro lado, é a verdadeira revolução.

Por que o Google Clips muda tudo

O Google Clips é uma câmera de US $ 249 para os pais.

Vou especular por que o Google optou por segmentar esse grupo demográfico específico em um momento. Mas, primeiro, alguns fatos sobre a própria câmera.

Clips é uma câmera de 12 megapixels. A caixa tem cinco centímetros por cinco centímetros quadrados e tem um clipe na parte traseira. A frente possui uma caixa de lente grande angular preta redonda (a lente captura 130 graus) e uma luz que pisca enquanto tira fotos, o que torna óbvio que é uma câmera, não uma câmera espiã.

A própria câmera do Clips não tem tela. Em vez disso, você usa um smartphone para revisar as fotos e controlar a câmera de outras maneiras. A câmera possui um botão para tirar fotos, mas essa não deve ser a principal forma de tirar as fotos.

Até agora, a câmera que descrevi soa como qualquer outro produto existente, incluindo as câmeras “lifelogging” que eu falei anteriormente neste espaço.

Mas a parte revolucionária é o software. O Google Clips usa inteligência artificial (IA) para escolher quando tirar fotos. Para “usar” a câmera, você torce a lente para ligá-la, coloca-a em algum lugar e depois esquece.

Ele aprende rostos familiares e, em seguida, favorece essas pessoas (e animais de estimação!) Ao decidir quando tirar fotos. Procura sorrisos e ação, situações novas e outros critérios. Ele descarta fotos borradas.

Cada vez que tira fotos, ele captura uma sequência de fotos a 15 quadros por segundo, que você pode usar ou editar como um GIF ou a partir da qual você pode escolher suas fotos favoritas.

O Clips não tem microfone e não pode gravar som.

Resumindo, a IA foi projetada para tirar ótimas fotos e GIFs, mas com a vantagem de tirar fotos onde não há fotógrafo por perto para alterar as ações do fotografado.

E aqui está a revolução: o reconhecimento de rosto ocorre no dispositivo, não na nuvem. As imagens são armazenadas no dispositivo, não na nuvem.

Esses são os atributos que o Google apregoa como garantia de privacidade. Sem som. Sem upload automático.

Claro, você pode usar o aplicativo para escolher clipes para enviar para o Google Fotos. Depois de carregadas no Google Fotos, as imagens serão processadas novamente para reconhecimento facial e, desta vez, com nomes anexados, se você tiver usado o recurso de nome para rosto no Google Fotos.

Por que o Google direcionou os clipes aos pais

Estou especulando aqui, mas acredito que o Google chegou aos pais por meio de um processo de eliminação.

O Google foi duramente atingido com seu experimento do Google Glass, porque aquele dispositivo colocou uma câmera no rosto das pessoas, o que causou desconforto em grande parte do público e da imprensa.

Desde então, um grande número de startups lançou câmeras de encaixe pequenas, quadradas e usáveis, a maioria das quais fracassou no mercado devido ao alto preço, baixa qualidade de imagem e ao fato de que usar uma câmera pode ser socialmente estranho.

O Google Clips se parece externamente com qualquer uma dessas câmeras, e meu palpite é que a intenção inicial do Google era juntar-se a eles e vencê-los, oferecendo uma câmera portátil com clipe alimentada por IA

Mas o Google estava certo no anúncio: câmeras com clip produzem fotos especialmente horríveis. Eles tendem a ficar desfocados. O ângulo está errado. Não é uma boa experiência.

Por essa ou alguma outra razão, o Google decidiu desencorajar a fixação da câmera Clip nas roupas.

A câmera Clips no estado em que se encontra é uma câmera de segurança inferior e uma câmera de ação inferior.

Mas os pais são um mercado-alvo perfeito. A razão é que eles simplesmente não conseguem tirar fotos suficientes de seus filhos. Tirar fotos de crianças freqüentemente interfere na vida normal. As crianças sabem que os pais estão tirando fotos, então elas param o que estão fazendo ou posam ou reclamam por terem suas fotos tiradas.

A câmera Clipes é uma solução. Os pais podem configurá-lo e esquecê-lo. Quando eles voltam mais tarde, talvez a câmera tenha capturado algum momento incrível sem qualquer interrupção.

O melhor de tudo é que é privado e seguro; nada é enviado a menos que expressamente selecionado para envio.

A verdadeira revolução é: IA na câmera

É claro que a missão do Google tem pouco a ver com a venda de câmeras. É tudo uma questão de encontrar um caminho para IA baseada em câmera

O Google chega a produtos como o Clips trabalhando no sentido inverso do objetivo de usar os dados de novas maneiras para beneficiar usuários, clientes, a humanidade o que for.

A IA em geral e o aprendizado de máquina em particular oferecem novas oportunidades para gerar ações e percepções a partir de dados acionados por sensores.

As câmeras são a mãe de todos os sensores, em parte por causa da qualidade dos dados e em parte por causa da onipresença das câmeras.

O público está apreensivo com a invasão de privacidade e, de fato, a invasão de privacidade é real e desenfreada. Como aplicar IA aos dados da câmera com segurança? Coloque-o na câmera!

Comece com as câmeras dos pais, vá depois para as câmeras do painel, webcams e câmeras de segurança e, eventualmente, coloque câmeras em todos os lugares. Com a IA embutida nas câmeras, o “produto” das câmeras de nível industrial nunca precisa ser imagens ou vídeos, apenas percepções.

Essa ideia mudará tudo para as empresas.

Qual é a ideia? Imagine o que é possível com câmeras baseadas em IA em que a saída são dados, em vez de imagens.

Por exemplo, imagine câmeras em um grande depósito. Sua saída pode ser listas minuto a minuto de quem entra e sai, quantos widgets estão armazenados na instalação em um determinado momento e outros dados úteis.

Outros aplicativos podem envolver dados e imagens, trabalhando juntos.

As câmeras de segurança podem funcionar de maneira oposta às do Google Clips. Assim como o segurança humano na recepção, eles podiam conhecer rostos familiares e ignorá-los, enquanto ampliavam, rastreavam e registravam o comportamento e o movimento de rostos desconhecidos. A IA pode identificar comportamentos suspeitos e relatá-los. As imagens puderam posteriormente ser extraídas como prova.

Outra função importante poderia ser medir literalmente os “sentimentos” do consumidor.

Uma empresa chamada Silver Logic Labs está trabalhando em um algoritmo que assiste a vídeos para identificar como as pessoas se sentem. Uma aplicação é substituir as classificações da TV Nielsen por dados em tempo real sobre como o público se sente sobre o que está assistindo. A tecnologia pode funcionar por meio de uma webcam de laptop comum.

Os consumidores provavelmente não aceitarão o vídeo real carregado para a nuvem, onde seus rostos serão armazenados, reconhecidos e processados. Mas se o vídeo nunca saísse do chip da câmera e se apenas dados criptografados anônimos fossem transmitidos, os consumidores poderiam manter a privacidade e os estúdios de TV e anunciantes poderiam obter o sistema de medição de audiência definitivo.

Vidas podem ser salvas. A tecnologia da Silver Logic poderia ser usada para prever acidentes vasculares cerebrais ou para ajudar a polícia a julgar quem é uma ameaça e quem não é. O truque é superar o obstáculo da privacidade. Uma câmera que não pode transmitir fotos ou que compartilha apenas aquelas selecionadas por um mandado é um atalho para a privacidade.

O resultado final é que as câmeras são o sensor definitivo para dados que serão processados ​​por meio de IA. Mas, agora, a necessidade de privacidade está bloqueando a revolução.

A solução pode ser encontrada na câmera Clipes do Google. Ao colocar IA na própria câmera, é possível obter os benefícios dos dados da câmera sem os riscos de privacidade.

E é por isso que o Google está fazendo isso. São todos os benefícios dos dados de câmera processados ​​por IA sem a invasão de privacidade.