Google mostra um protótipo conversacional Gemini baseado em vídeo
O Google anunciou que a próxima conferência Google I/O 2024 começará em uma data iminente. Além disso, a gigante da tecnologia procura demonstrar ao público em geral os avanços significativos que alcançou em inteligência artificial durante este evento. Antecipando-se à conferência, o Google apresentou orgulhosamente um protótipo conversacional chamado “Gemini”, que possui a capacidade de fornecer respostas instantâneas a vídeos em tempo real.
Os chatbots baseados em inteligência artificial funcionaram inicialmente em resposta a dicas textuais. Posteriormente, sua capacidade foi ampliada para interpretar conteúdos visuais por meio do reconhecimento de imagens. Este desenvolvimento permitiu-lhes fornecer respostas e comentários sobre imagens específicas ou determinados aspectos das mesmas. Além disso, estes modelos avançados são capazes de produzir novos visuais baseados nos já existentes. Atualmente, parece que o campo está progredindo no sentido de incorporar capacidades de vídeo como o próximo marco significativo para tais avanços tecnológicos.
Google provoca um protótipo conversacional do Gemini usando vídeo antes do I/O 2024
Antes do I/O 2024, o Google está mostrando um pequeno vídeo de uma interação entre Gemini e um usuário. O que chama a atenção é que toda a interação é baseada em vídeos capturados em tempo real. O “teaser” mostra como Gêmeos consegue reconhecer o que está acontecendo na cena. Também pode focar especificamente em alguns elementos da cena, como o logotipo do Google I/O. Em seguida, o chatbot com tecnologia de IA responde às perguntas do usuário e até propõe novas perguntas para “bate-papo”.
Mais um dia até#GoogleIO! Estamos nos sentindo 🤩. Vejo você amanhã para as últimas notícias sobre IA, Pesquisa e muito mais.pic.twitter.com/QiS1G8GBf9
-Google (@Google)13 de maio de 2024
Na verdade, a integração do reconhecimento de vídeo em tempo real com capacidades de processamento de linguagem natural suscita admiração. No entanto, cabe-nos reconhecer que a demonstração apresentada foi apenas um protótipo, embora tenha funcionado eficazmente. Consequentemente, embora mais informações sobre esta tecnologia inovadora sejam divulgadas oportunamente, pode ser prudente ter paciência ao antecipar a sua ampla disponibilidade para consumo geral.
A possível conexão entre o lançamento do teaser pelo Google e os desenvolvimentos recentes feitos pela equipe ChatGPT da Open AI sugere um movimento deliberado em nome do Google. Isto é particularmente significativo devido ao lançamento da sua mais recente inovação, o GPT-4o, que apresenta maior velocidade e capacidade de resposta em tempo real através de capacidades de interação de vídeo. Consequentemente, parece que o lançamento deste teaser pode ter sido cuidadosamente cronometrado à luz destes eventos simultâneos na indústria da inteligência artificial.
*️⃣ Link da fonte:
mostrando um pequeno vídeo , #GoogleIO , pic.twitter.com/QiS1G8GBf9 , 13 de maio de 2024 ,