A OpenAI revela seu mais recente avanço em inteligência artificial com o lançamento de sua plataforma, Sora. Este novo modelo promete transformar instruções em texto (os chamados prompts) em vídeos realistas de até um minuto de duração.
A empresa destaca as capacidades avançadas do Sora, enfatizando sua habilidade única de criar "cenas complexas com múltiplos personagens, tipos específicos de movimento e detalhes precisos do objeto e do cenário".
Veja um exemplo no vídeo abaixo:
Isso oferece aos usuários a oportunidade de dar vida a suas ideias por meio de vídeos muito realistas gerados a partir de suas próprias sugestões de texto.
Criação de cenas realistas e imaginativas
O Sora não se limita apenas à geração de cenas realistas; ele também tem a capacidade de entender como objetos "existem no mundo físico" e interpretar detalhes e adereços, além de gerar personagens capazes de expressar expressar emoções.
O modelo pode criar vídeos com base em imagens estáticas, preencher quadros ausentes em vídeos existentes e até mesmo estender a duração de um vídeo.
Demonstrações impressionantes do Sora
O post de introdução da OpenAI inclui demonstrações do Sora, apresentando cenas como a corrida do ouro na Califórnia e vistas de um trem em Tóquio na neve.
Embora alguns vídeos revelem indícios de intervenção da IA, a OpenAI destaca a impressionante qualidade dos resultados alcançados pelo modelo.
Disponibilidade para o público
Atualmente, o Sora está em fase de avaliação por "red teamers", responsáveis por identificar possíveis danos e riscos associados ao modelo. A OpenAI também estendeu o acesso a artistas visuais, designers e cineastas para obter feedbacks valiosos.
A empresa reconhece que o modelo pode ter desafios em simular com precisão a física de cenas muito complexas e interpretar certos casos de causa e efeito.
SAIBA MAIS!