A OpenAI revelou hoje uma versão atualizada de sua ferramenta de conversão de texto em imagem, DALL-E, que usa ChatGPT – o chatbot de IA viral da OpenAI – para aliviar um pouco a dor das solicitações.

A maioria das ferramentas de geração de imagens de última geração baseadas em IA hoje recebem instruções – descrições de imagens – e as transformam em obras de arte em uma variedade de estilos, que vão do fotorrealista ao fantástico. Mas elaborar o aviso certo pode ser um desafio, tanto que a “engenharia de avisos” está se tornando uma profissão genuína.

A nova ferramenta da OpenAI, DALL-E 3, usa ChatGPT para ajudar a preencher prompts. Via ChatGPT, assinantes dos planos ChatGPT premium da OpenAI, ChatGPT Plus e ChatGPT Enterprise, podem digitar uma solicitação de imagem e aprimorá-la por meio de conversas com o chatbot – recebendo os resultados diretamente no aplicativo de chat.

O ChatGPT receberá um prompt de apenas algumas palavras e o tornará mais descritivo, fornecendo mais orientação ao modelo DALL-E 3.

A integração ChatGPT não é a única novidade no DALL-E 3. O DALL-E 3 também gera imagens de alta qualidade que refletem prompts com mais precisão, diz OpenAI – especialmente ao lidar com prompts mais longos. E lida melhor com conteúdo que historicamente tropeçou em modelos de geração de imagens, como texto e mãos humanas.

OpenAI DALL-E 3

Uma imagem gerada pelo DALL-E 3. Créditos da imagem: OpenAI

Além disso, o DALL-E 3 possui novos mecanismos para reduzir o viés algorítmico e melhorar a segurança – ou pelo menos é o que diz a OpenAI. Por exemplo, o DALL-E 3 rejeitará pedidos que solicitem uma imagem no estilo de artistas vivos ou que retratem figuras públicas. E os artistas agora podem optar por não ter certas – ou todas – suas obras de arte usadas para treinar futuras gerações de modelos de texto para imagem OpenAI. (A OpenAI, juntamente com alguns de seus rivais, está enfrentando um processo por supostamente usar trabalhos protegidos por direitos autorais de artistas para treinar seus modelos de imagem generativos de IA.)

O lançamento do DALL-E 3 ocorre no momento em que a corrida da IA ​​generativa esquenta, especialmente no domínio da síntese de imagens. Concorrentes como Midjourney e Stability AI continuam a refinar seus modelos de geração de imagens, pressionando a OpenAI para manter o ritmo.

A OpenAI planeja lançar o DALL-E 3 para usuários premium do ChatGPT em outubro, seguido por laboratórios de pesquisa e seus clientes de API. A empresa não disse quando – ou se – planeja lançar uma ferramenta web gratuita, como fez com o DALL-E 2 e o modelo DALL-E original.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *