ChatGPT fica mais inteligente e agora consegue entender vídeos em tempo real

William Schendes

13 dezembro 2024, 16:46

Na semana cheia de novidades dos produtos da OpenAI, o ChatGPT finalmente começou a liberar uma atualização que foi anunciada no início deste ano. Nesta semana, a empresa divulgou que o recurso Advanced Voice Mode (modo de voz avançado) está recebendo a capacidade de visualizar imagens em tempo real.

A novidade, chamada Live Vision, começou a ser lançada na última quinta-feira (12) para usuários do ChatGPT Plus e Pro. De acordo com a OpenAI, a funcionalidade estará disponível para assinantes dos planos Enterprise e Edu a partir de janeiro.

ChatGPT fica mais inteligente e agora consegue entender vídeos em tempo real — Recurso Live Vision. (Imagem: OpenAI)

A capacidade do ChatGPT de interpretar imagens foi apresentada em maio deste ano durante a transmissão Spring Updates como um recurso complementar ao modo de conversação avançado. No entanto, até agora, a empresa havia liberado o Advanced Voice Mode apenas com suporte a áudio.

Em uma demonstração recente para anunciar o lançamento do Live Vision, a equipe da OpenAI interagiu com o chatbot por meio de um celular no modo de voz, mantendo a câmera do aparelho ligada. Durante a interação, os profissionais desenharam um corpo em um quadro e pediram que o ChatGPT interpretasse o que estava sendo ilustrado.

Say ho ho ho to Santa in Voice Mode 🎅Santa is rolling out today to everyone across all ChatGPT platforms and is available until the end of the month…then he will retire back to the North Pole. pic.twitter.com/NVS9bRok4r

— OpenAI (@OpenAI) 12 de dezembro de 2024

Além de interpretar as imagens captadas pela câmera do dispositivo móvel, o Live Vision consegue visualizar e entender o que está na tela do aparelho para realizar consultas e interagir com os usuários. Para ativar o recurso, basta selecionar a opção “Compartilhar Tela” no menu de três pontos, disponível no modo de voz.

O anúncio da liberação do Live Vision chega dias após a OpenAI lançar o Sora, seu modelo de IA para geração de vídeos. Conheça!

Para ficar por dentro das principais notícias de tecnologia, siga o TechShake no Instagram.

VEJA TAMBÉM!

William Schendes

Jornalista e redator de conteúdo. Cobre tecnologia, games e cibersegurança desde 2022. No TechShake, acompanha e escreve sobre notícias do mundo tech, mas também produz reportagens, reviews, artigos especiais e tutoriais. Tem uma sugestão de pauta ou release? Mande para williamschendesps@outlook.com

TECHSHAKE recomenda: