A OpenAI anunciou o DALL-E 3, uma nova e aprimorada versão do seu popular AI generativo de imagens. Conteúdo mais preciso (entenda "imagens ainda mais incríveis") e uma integração com o chatbot ChatGPT estão entre as principais novidades do novo momento da popular IA de imagens.
A partir do início de outubro, assinantes do ChatGPT Plus do pacote Enterprise já poderão conferir as inovações lançadas pelo DALL-E 3.
DALL-E 3 terá ChatGPT como "parceiro de brainstorming"
Durante o anúncio do DALL-E 3, a OpenAI explicou como a integração com o ChatGPT deve funcionar. Sim, agora é possível fazer um pedido de imagem direto ao popular chatbot, mas essa nova "parceria" entre as duas IAs vai além.
“A DALL-E 3 foi criada de forma nativa com o ChatGPT, o que permite a você usar o ChatGPT como um parceiro de brainstorming e um refinador de prompts”, afirmou a OpenAI em seu blog oficial.
Isso significa que o ChatGPT não apenas pode ligar o usuário diretamente a DALL-E 3, mas também vai ajudar na forma como descrevemos e solicitamos a imagem que queremos gerar, para alcançar ainda mais precisão. “Simplesmente peça ao ChatGPT o que você quer ver, desde uma sentença simples a um parágrafo detalhado”, adicionou a empresa.
Imagens mais precisas com prompts mais simples
Prompts são as instruções que damos a uma IA para gerar o conteúdo que queremos. Quanto mais detalhado seja o prompt, a descrição da imagem que queremos, mas chances de IA acertar na geração de forma mais precisa. Mas a DALL-E 3 quer ajudar com isso.
Além de contar com a integração com o ChatGPT para ajudar na elaboração dos prompts, a nova versão da IA geradora de imagens promete criar imagens ainda mais precisas com prompts mais simples.
De acordo com a OpenAI, a DALL-E 3 é mais "amigável" às descrições textuais, exigindo menos técnica na criação dos prompts e superando sua versão anterior ao atender demandas mais complexas.
“Sistemas modernos de texto para imagem tem a tendência de ignorar palavras ou descrições, forçando os usuários a aprenderem engenharia de prompt. A DALL-E 3 representa um salto adiante na habilidade de gerar imagens que correspondem exatamente ao texto que você fornece”, escreveu a empresa de Sam Altman, no anúncio oficial da DALL-E 3.
Para provar as "melhorias significativas em relação ao DALL-E 2", a OpenAI divulgou duas imagens (acima) criadas por meio do mesmo prompt, mas uma em cada versão da tecnologia. O prompt foi: "Uma pintura em óleo expressiva de um jogador de basquete enterrando, retratada como a explosão de uma nebulosa."
DALL-E 3 permitirá gerar texto legível nas imagens
Outro recurso que deve ser muito bem recebido pelo público é a possibilidade de gerar texto legível diretamente nas imagens criadas pela IA. A nova ferramenta deve auxiliar na criação de infográficos e outros arquivos que precisar unir texto e imagem.
A novidade também faz com que a DALL-E 3 consiga competir diretamente com IA como o Ideogram. A startup lançada por ex-funcionários do Google no mês passado é uma plataforma de IA para criação de imagens, e já permitia o uso de textos para gerar, por exemplo, pôsteres.
As imagens geradas no Ideogram, contudo, têm caráter público e ficam disponíveis para todos os usuários.
Reforço de segurança e controle criativo
Reforço de segurança e controle criativo. essa é outra promessa da DALL-E 3. No texto publicado no blog da OpenAI, as informações destacaram que a nova tecnologia tem “mitigações para recusar solicitações que pedem [criações de] uma figura pública pelo nome”.
O reforço ainda mira no combate à geração de materiais preconceituosos. Caso se comprovem efetivas, essas medidas de segurança já partem na frente de outras IA.
Para evitar também o uso de trabalhos com direitos autorais, a OpenAI garantiu que "criadores agora podem pedir para remover suas imagens do treinamento de nossos futuros modelos de geração de imagens.”
Além disso, a ferramenta terá a capacidade de recusar solicitações para criar imagens "inspiradas" no trabalho de artistas vivos, como forma de manter um controle criativo e um respeito a outros artistas.
Confira outras imagens compartilhadas pela OpenAI na rede social X para demonstrar o potencial do DALL-E 3
FIQUE POR DENTRO!
- Dano que iOS 17 causa à bateria era esperado e deve ser temporário
- TikTok lança recurso para rotular conteúdo de IA e novas ferramentas
- Neuralink iniciará testes em humanos de implante cerebral para paralisia
- Brasileira passa em 10 universidades internacionais com carta da NASA