Durante o Google I/O 2024, realizado nesta terça-feira (14), a gigante das buscas revelou dois novos modelos de IA para edição e geração de vídeos: Veo e Imagen 3.
Sobre o Veo, a empresa explica que ele é o seu modelo de geração de vídeo de última geração capaz de gerar mídias com resolução em 1080p. A ferramenta permite implementar diversos estilos cinematográficos e visuais.
A geração dos conteúdos acontece a partir de prompts (comandos) de texto. De acordo com o comunicado, o Veo tem um conhecimento avançado de linguagem natural e semântica para interpretar as solicitações. Como destaca o Android Authority, a ferramenta é capaz de entender termos cinematográficos, como “timelapse” e “fotos aéreas de uma paisagem”.
As imagens são impressionantes, demonstrando que o Veo é capaz de criar cenas realistas e complexas. Confira os vídeos abaixo:
“Com o Veo, aprimoramos as técnicas de como o modelo aprende a entender o que está em um vídeo, renderiza imagens de alta definição, simula a física do nosso mundo e muito mais. Esses aprendizados impulsionarão avanços em nossa pesquisa em IA e nos permitirão criar produtos ainda mais úteis que ajudam as pessoas a interagir e se comunicar de novas maneiras.”
- Google.
Outra novidade apresentada foi o Imagen 3, a nova ferramenta da empresa para geração de imagens fotorrealistas que também conta com uma compreensão avançada de linguagem.
“Imagen 3 gera imagens visualmente ricas e de alta qualidade, com boa iluminação e composição. Ele pode renderizar com precisão pequenos detalhes, como rugas finas na mão de uma pessoa, e texturas complexas, como um elefante de pelúcia de malha.”
- Google.
FIQUE POR DENTRO!