OpenAI anuncia DALL-E 3 com conteúdo mais preciso e integração com ChatGPT

Sabryna Esmeraldo
Sabryna Esmeraldo

A OpenAI anunciou o DALL-E 3, uma nova e aprimorada versão do seu popular AI generativo de imagens. Conteúdo mais preciso (entenda "imagens ainda mais incríveis") e uma integração com o chatbot ChatGPT estão entre as principais novidades do novo momento da popular IA de imagens.

A partir do início de outubro, assinantes do ChatGPT Plus do pacote Enterprise já poderão conferir as inovações lançadas pelo DALL-E 3.

DALL-E 3 terá ChatGPT como "parceiro de brainstorming"

Imagem criada pelo DALL-E 3 a partir do prompt "Uma ilustração de um coração humano feito de vidro translúcido, sobre um pedestal em meio a um mar tempestuoso. Raios de sol perfuram as nuvens, iluminando o coração, revelando um pequeno universo dentro dele. A frase 'Encontre o universo dentro de você' está gravada em letras em negrito no horizonte." (Imagem: Divulgação / OpenAI)

Durante o anúncio do DALL-E 3, a OpenAI explicou como a integração com o ChatGPT deve funcionar. Sim, agora é possível fazer um pedido de imagem direto ao popular chatbot, mas essa nova "parceria" entre as duas IAs vai além.

“A DALL-E 3 foi criada de forma nativa com o ChatGPT, o que permite a você usar o ChatGPT como um parceiro de brainstorming e um refinador de prompts”, afirmou a OpenAI em seu blog oficial.

Isso significa que o ChatGPT não apenas pode ligar o usuário diretamente a DALL-E 3, mas também vai ajudar na forma como descrevemos e solicitamos a imagem que queremos gerar, para alcançar ainda mais precisão. “Simplesmente peça ao ChatGPT o que você quer ver, desde uma sentença simples a um parágrafo detalhado”, adicionou a empresa.

Imagens mais precisas com prompts mais simples

Imagem criada pelo DALL-E 3 a partir do prompt "Pequenos reis da batata usando coroas majestosas, sentados em tronos, supervisionando seu vasto reino da batata cheio de súditos e castelos de batata." (Imagem: Divulgação / OpenAI)

Prompts são as instruções que damos a uma IA para gerar o conteúdo que queremos. Quanto mais detalhado seja o prompt, a descrição da imagem que queremos, mas chances de IA acertar na geração de forma mais precisa. Mas a DALL-E 3 quer ajudar com isso.

Além de contar com a integração com o ChatGPT para ajudar na elaboração dos prompts, a nova versão da IA geradora de imagens promete criar imagens ainda mais precisas com prompts mais simples.

De acordo com a OpenAI, a DALL-E 3 é mais "amigável" às descrições textuais, exigindo menos técnica na criação dos prompts e superando sua versão anterior ao atender demandas mais complexas.

“Sistemas modernos de texto para imagem tem a tendência de ignorar palavras ou descrições, forçando os usuários a aprenderem engenharia de prompt. A DALL-E 3 representa um salto adiante na habilidade de gerar imagens que correspondem exatamente ao texto que você fornece”, escreveu a empresa de Sam Altman, no anúncio oficial da DALL-E 3.

Comparação de imagens geradas pelo DALL-E 2 e pelo DALL-E 3 a partir do mesmo prompt (Imagem: Divulgação / OpenAI)

Para provar as "melhorias significativas em relação ao DALL-E 2", a OpenAI divulgou duas imagens (acima) criadas por meio do mesmo prompt, mas uma em cada versão da tecnologia. O prompt foi: "Uma pintura em óleo expressiva de um jogador de basquete enterrando, retratada como a explosão de uma nebulosa."

DALL-E 3 permitirá gerar texto legível nas imagens

DALL-E 3 permitirá criar imagens com texto (Imagem: Divulgação / OpenAI)

Outro recurso que deve ser muito bem recebido pelo público é a possibilidade de gerar texto legível diretamente nas imagens criadas pela IA. A nova ferramenta deve auxiliar na criação de infográficos e outros arquivos que precisar unir texto e imagem.

A novidade também faz com que a DALL-E 3 consiga competir diretamente com IA como o Ideogram. A startup lançada por ex-funcionários do Google no mês passado é uma plataforma de IA para criação de imagens, e já permitia o uso de textos para gerar, por exemplo, pôsteres.

As imagens geradas no Ideogram, contudo, têm caráter público e ficam disponíveis para todos os usuários.

Reforço de segurança e controle criativo

Reforço de segurança e controle criativo. essa é outra promessa da DALL-E 3. No texto publicado no blog da OpenAI, as informações destacaram que a nova tecnologia tem “mitigações para recusar solicitações que pedem [criações de] uma figura pública pelo nome”.

O reforço ainda mira no combate à geração de materiais preconceituosos. Caso se comprovem efetivas, essas medidas de segurança já partem na frente de outras IA.

Para evitar também o uso de trabalhos com direitos autorais, a OpenAI garantiu que "criadores agora podem pedir para remover suas imagens do treinamento de nossos futuros modelos de geração de imagens.”

Além disso, a ferramenta terá a capacidade de recusar solicitações para criar imagens "inspiradas" no trabalho de artistas vivos, como forma de manter um controle criativo e um respeito a outros artistas.

Confira outras imagens compartilhadas pela OpenAI na rede social X para demonstrar o potencial do DALL-E 3

Imagem criada pelo DALL-E 3 a partir do prompt "Uma mulher de meia-idade de ascendência asiática, com cabelos escuros com mechas prateadas, parece fraturada e lascada, intrinsecamente incrustada em um mar de porcelana quebrada. A porcelana brilha com padrões de tinta respingados em uma mistura harmoniosa de azuis brilhantes e foscos, verdes, laranjas e vermelhos, capturando sua dança em uma justaposição surreal de movimento e quietude. Seu tom de pele, um tom claro como a porcelana, adiciona uma qualidade quase mística à sua forma." (Imagem: Divulgação / OpenAI)
Imagem criada pelo DALL-E 3 a partir do prompt "Um edifício de arquitectura moderna com grandes janelas de vidro, situado numa falésia com vista para um oceano sereno ao pôr do sol." (Imagem: Divulgação / OpenAI)
Imagem criada pelo DALL-E 3 a partir do prompt "Uma animação 2D de uma banda de música folk composta por folhas antropomórficas de outono, cada uma tocando instrumentos tradicionais de bluegrass, em meio a um cenário de floresta rústica salpicado pela luz suave de uma lua cheia." (Imagem: Divulgação / OpenAI)

FIQUE POR DENTRO!

  • Dano que iOS 17 causa à bateria era esperado e deve ser temporário
  • TikTok lança recurso para rotular conteúdo de IA e novas ferramentas
  • Neuralink iniciará testes em humanos de implante cerebral para paralisia
  • Brasileira passa em 10 universidades internacionais com carta da NASA
Sabryna Esmeraldo
Sabryna Esmeraldo
Sabryna trabalha com comunicação há mais de dez anos e especializou-se a produzir conteúdos e tutoriais sobre aplicações e tecnologia. Consumidora ávida de streamings e redes sociais, adora descobrir as novidades deste mundo.
recomenda: