OpenAI lança gerador de imagens 4o, com maior precisão e resultados fotorrealistas


A OpenAI anunciou ontem que o seu modelo GPT-4o ganhou um novo gerador de imagens, com foco no uso prático, com maior precisão na renderização de textos e uma maior fidelidade ao conteúdo dos prompts. Segundo a OpenAI, o novo modelo conta com a possibilidade de transformar ou editar imagens pelos usuários, além de usá-las como inspiração visual.
Confira abaixo vídeo de apresentação do novo modelo de imagens 4o da OpenAI.
Outro diferencial do novo modelo é a consistência de personagens, algo fundamental para a criação de um game ou uma história em quadrinhos. Além disso, também é possível fazer o “inpainting”, com a inclusão de pessoas ou objetos em imagens.

O modelo foi treinado com “dados disponíveis publicamente” e também com dados de empresas como a Shutterstock, que tem uma parceria com a OpenAI. O COO da OpenAI, Brad Lightcap, disse ao Wall Street Journal que a empresa está “respeitando os direitos dos artistas na forma como fazemos a produção, e temos políticas em vigor que nos impedem de gerar imagens que imitem diretamente o trabalho de qualquer artista vivo”.
Com o novo modelo, a OpenAI dá uma resposta imediata a concorrentes como o Reve, que também conta com maior precisão de prompts e renderização de textos.
Vídeos de demonstração do novo gerador de imagens do GPT-4o
No vídeo abaixo, você pode ver como é possível mudar o estilo de imagens com o novo modelo de imagens 4o da OpenAI.
Outra novidade são as camadas transparentes do modelo de imagem 4o, assim é possível pedir para ele criar uma imagem com fundo transparente, algo muito útil para montagens.
O vídeo abaixo mostra como a renderização de textos foi aprimorada no novo modelo 4o.
Abaixo, você pode ver como o modelo de imagens 4o consegue seguir instruções bem detalhadas.
E finalmente, o último vídeo de demonstração mostra como o gerador de imagem 4o da OpenAI consegue manter a consistência em personagens.
Por enquanto, o novo modelo de imagens do GPT-4o está disponível no ChatGPT e no Sora para os usuários do plano Pro, que custa salgados US$ 200 mensais, mas em breve deve ser liberado para usuários Plus e até para os usuários do ChatGPT na versão gratuita. O modelo ainda não funciona em API, mas isso também deve ser resolvido em breve pela OpenAI.
Via TechCrunch