OpenAI anuncia DALL-E 3 com conteúdo mais preciso e integração com ChatGPT

Sabryna Esmeraldo

21 setembro 2023, 08:11

A OpenAI anunciou o DALL-E 3, uma nova e aprimorada versão do seu popular AI generativo de imagens. Conteúdo mais preciso (entenda "imagens ainda mais incríveis") e uma integração com o chatbot ChatGPT estão entre as principais novidades do novo momento da popular IA de imagens.

A partir do início de outubro, assinantes do ChatGPT Plus do pacote Enterprise já poderão conferir as inovações lançadas pelo DALL-E 3.

DALL-E 3 terá ChatGPT como "parceiro de brainstorming"

Imagem criada pelo DALL-E 3 a partir do prompt "Uma ilustração de um coração humano feito de vidro translúcido, sobre um pedestal em meio a um mar tempestuoso. Raios de sol perfuram as nuvens, iluminando o coração, revelando um pequeno universo dentro dele. A frase 'Encontre o universo dentro de você' está gravada em letras em negrito no horizonte." (Imagem: Divulgação / OpenAI)

Durante o anúncio do DALL-E 3, a OpenAI explicou como a integração com o ChatGPT deve funcionar. Sim, agora é possível fazer um pedido de imagem direto ao popular chatbot, mas essa nova "parceria" entre as duas IAs vai além.

“A DALL-E 3 foi criada de forma nativa com o ChatGPT, o que permite a você usar o ChatGPT como um parceiro de brainstorming e um refinador de prompts”, afirmou a OpenAI em seu blog oficial.

Isso significa que o ChatGPT não apenas pode ligar o usuário diretamente a DALL-E 3, mas também vai ajudar na forma como descrevemos e solicitamos a imagem que queremos gerar, para alcançar ainda mais precisão. “Simplesmente peça ao ChatGPT o que você quer ver, desde uma sentença simples a um parágrafo detalhado”, adicionou a empresa.

Imagens mais precisas com prompts mais simples

Imagem criada pelo DALL-E 3 a partir do prompt "Pequenos reis da batata usando coroas majestosas, sentados em tronos, supervisionando seu vasto reino da batata cheio de súditos e castelos de batata." (Imagem: Divulgação / OpenAI)

Prompts são as instruções que damos a uma IA para gerar o conteúdo que queremos. Quanto mais detalhado seja o prompt, a descrição da imagem que queremos, mas chances de IA acertar na geração de forma mais precisa. Mas a DALL-E 3 quer ajudar com isso.

Além de contar com a integração com o ChatGPT para ajudar na elaboração dos prompts, a nova versão da IA geradora de imagens promete criar imagens ainda mais precisas com prompts mais simples.

De acordo com a OpenAI, a DALL-E 3 é mais "amigável" às descrições textuais, exigindo menos técnica na criação dos prompts e superando sua versão anterior ao atender demandas mais complexas.

“Sistemas modernos de texto para imagem tem a tendência de ignorar palavras ou descrições, forçando os usuários a aprenderem engenharia de prompt. A DALL-E 3 representa um salto adiante na habilidade de gerar imagens que correspondem exatamente ao texto que você fornece”, escreveu a empresa de Sam Altman, no anúncio oficial da DALL-E 3.

Comparação de imagens geradas pelo DALL-E 2 e pelo DALL-E 3 a partir do mesmo prompt (Imagem: Divulgação / OpenAI)

Para provar as "melhorias significativas em relação ao DALL-E 2", a OpenAI divulgou duas imagens (acima) criadas por meio do mesmo prompt, mas uma em cada versão da tecnologia. O prompt foi: "Uma pintura em óleo expressiva de um jogador de basquete enterrando, retratada como a explosão de uma nebulosa."

DALL-E 3 permitirá gerar texto legível nas imagens

DALL-E 3 permitirá criar imagens com texto (Imagem: Divulgação / OpenAI)

Outro recurso que deve ser muito bem recebido pelo público é a possibilidade de gerar texto legível diretamente nas imagens criadas pela IA. A nova ferramenta deve auxiliar na criação de infográficos e outros arquivos que precisar unir texto e imagem.

A novidade também faz com que a DALL-E 3 consiga competir diretamente com IA como o Ideogram. A startup lançada por ex-funcionários do Google no mês passado é uma plataforma de IA para criação de imagens, e já permitia o uso de textos para gerar, por exemplo, pôsteres.

As imagens geradas no Ideogram, contudo, têm caráter público e ficam disponíveis para todos os usuários.

Reforço de segurança e controle criativo

Reforço de segurança e controle criativo. essa é outra promessa da DALL-E 3. No texto publicado no blog da OpenAI, as informações destacaram que a nova tecnologia tem “mitigações para recusar solicitações que pedem [criações de] uma figura pública pelo nome”.

O reforço ainda mira no combate à geração de materiais preconceituosos. Caso se comprovem efetivas, essas medidas de segurança já partem na frente de outras IA.

Para evitar também o uso de trabalhos com direitos autorais, a OpenAI garantiu que "criadores agora podem pedir para remover suas imagens do treinamento de nossos futuros modelos de geração de imagens.”

Além disso, a ferramenta terá a capacidade de recusar solicitações para criar imagens "inspiradas" no trabalho de artistas vivos, como forma de manter um controle criativo e um respeito a outros artistas.

Confira outras imagens compartilhadas pela OpenAI na rede social X para demonstrar o potencial do DALL-E 3

Imagem criada pelo DALL-E 3 a partir do prompt "Uma mulher de meia-idade de ascendência asiática, com cabelos escuros com mechas prateadas, parece fraturada e lascada, intrinsecamente incrustada em um mar de porcelana quebrada. A porcelana brilha com padrões de tinta respingados em uma mistura harmoniosa de azuis brilhantes e foscos, verdes, laranjas e vermelhos, capturando sua dança em uma justaposição surreal de movimento e quietude. Seu tom de pele, um tom claro como a porcelana, adiciona uma qualidade quase mística à sua forma." (Imagem: Divulgação / OpenAI)

Imagem criada pelo DALL-E 3 a partir do prompt "Um edifício de arquitectura moderna com grandes janelas de vidro, situado numa falésia com vista para um oceano sereno ao pôr do sol." (Imagem: Divulgação / OpenAI)

Imagem criada pelo DALL-E 3 a partir do prompt "Uma animação 2D de uma banda de música folk composta por folhas antropomórficas de outono, cada uma tocando instrumentos tradicionais de bluegrass, em meio a um cenário de floresta rústica salpicado pela luz suave de uma lua cheia." (Imagem: Divulgação / OpenAI)

FIQUE POR DENTRO!

Dano que iOS 17 causa à bateria era esperado e deve ser temporário
TikTok lança recurso para rotular conteúdo de IA e novas ferramentas
Neuralink iniciará testes em humanos de implante cerebral para paralisia
Brasileira passa em 10 universidades internacionais com carta da NASA

Sabryna Esmeraldo

Sabryna trabalha com comunicação há mais de dez anos e especializou-se a produzir conteúdos e tutoriais sobre aplicações e tecnologia. Consumidora ávida de streamings e redes sociais, adora descobrir as novidades deste mundo.

TECHSHAKE recomenda: