A Microsoft anunciou sua nova ferramenta de Inteligência Artificial generativa para vídeos. A IA VASA-1 é capaz de gerar vídeos extremamente realistas a partir de uma única imagem e um clipe de áudio. Seus recursos são tão incríveis que acabam também por causar um grande receio sobre os riscos do uso mal intencionado de suas capacidades.
O poderoso VASA-1
O VASA-1 se trata de um modelo de IA generativa de imagem para vídeo. Conforme é possível ver nos exemplos publicados pela Microsoft, seus resultados trazem um realismo que confunde a linha entre o vídeo real e o fabricado. A partir de apenas uma imagem, um clipe de áudio e orientações em texto sobre o que deseja em seu vídeo, a IA criar clipes chocantemente realistas, com movimentos e expressões faciais e conversas no tom de voz correto.
No anúncio da nova ferramenta, a Microsoft destacou as capacidades da nova IA:
“O VASA-1 é capaz não apenas de produzir uma preciosa sincronização de áudio labial, mas também de capturar um amplo espectro de emoções e nuances faciais expressivas e movimentos naturais da cabeça que contribuem para a percepção de realismo e vivacidade", explicou a empresa.
Os vídeos gerados pelo VASA-1 tem alta resolução (512×512) a impressionantes 45 FPS. No caso de vídeos apenas de rostos falando, os resultados realistas chegam a 40 FPS em tempo real. A IA deu o que falar pelas redes, com vários usuários do X compartilhando exemplos que a Micrososft já disponibilizou do uso da ferramenta.
Benefícios e preocupações com o VASA-1
As possíveis aplicações do VASA-1 são inúmeras. A IA poderia ser utilizada como uma ferramenta educacional, "dando vida", por exemplo, a figuras históricas. A criação de companheiros virtuais, acompanhada por especialistas, poderia também ter aplicação terapêutica. Contudo, a notícia sobre o poder da nova IA provocou mais preocupações do que boas expectativas.
O VASA-1 poderia ser utilizado para a criação dos chamados "deepfakes", agora mais convincentes do que nunca. Imagine um vídeo falso sendo usado como "prova" de um crime? Ou um clipe gerado pela IA espalhando mentiras sobre figuras públicas como políticos. O potencial de desinformação é algo que deve ser considerado pela Microsoft.
No anúncio da IA, a Microsoft afirmou que não lançará a tecnologia de forma prematura, mantendo o plano de esperar por regulamentações robustas quanto ao uso da IA em toda a indústria tecnológica.
“…como outras técnicas de geração de conteúdo relacionadas, ainda pode ser potencialmente utilizada indevidamente para se passar por humanos. Opomo-nos a qualquer comportamento para criar conteúdo enganoso ou prejudicial de pessoas reais…”, afirmou a empresa.
FIQUE POR DENTRO!