Imagens do ChatGPT 2.0 chegaram! A precisão na geração de texto melhora significativamente, permitindo criar facilmente cartazes de marketing

A OpenAI anunciou oficialmente na terça-feira a chegada do ChatGPT Images 2.0, não só melhorando substancialmente a precisão na geração de texto, como também a estética de design em cartazes e retratos. O modelo introduz também pela primeira vez um “modo de pensamento”, que permite que a geração de imagens tenha capacidades de pesquisa na web e de saída em lote de várias imagens, aproximando-se de forma abrangente de cenários de aplicação comerciais.

(A Canva anuncia integração profunda com o Claude, permitindo transformar rascunhos de IA em peças de design prontas)

Do nada até um menu perfeito: a IA finalmente aprendeu a soletrar

Ao recordar há dois anos, os pontos fracos dos modelos de geração de imagens por IA na geração de texto são praticamente do conhecimento geral. Desde que o pedido inclua necessidades de texto, o resultado costuma estar cheio de erros de ortografia absurdos e até de invenções. Isto é ainda mais grave em línguas como o japonês, coreano e chinês, que não são inglês.

Imagem ilustrativa do cartaz oficial em coreano

Agora, o ChatGPT Images 2.0 já consegue gerar um cartaz de divulgação que pode ser usado diretamente pelos operadores, com texto nítido e preciso. Nos últimos anos, os investigadores têm explorado activamente novas arquiteturas como modelos de auto-retroalimentação (Autoregressive Models), e a lógica de funcionamento, a compreensão do texto, as capacidades de geração e de verificação melhoraram de forma significativa.

Modo de pensamento em funcionamento: pesquisa online e consistência na composição, tudo bem resolvido

A actualização mais central do ChatGPT Images 2.0 está no “modo de pensamento (Thinking Capabilities)”, que actualmente está disponível para utilizadores pagantes do ChatGPT Plus, Pro, da versão comercial e da versão empresarial. Após activação, o modelo consegue pesquisar informações na web em tempo real para auxiliar a geração de imagens; também consegue criar descrições visuais correspondentes a partir dos ficheiros enviados pelo utilizador e, antes da saída final, realiza uma auto-revisão e optimização do conteúdo das imagens.

Na geração em lote, no modo de pensamento, com um único pedido é possível produzir até oito imagens de uma só vez, e entre as imagens consegue manter consistentemente as características do personagem, o estilo dos objectos e o estilo global. Isto é adequado para painéis de histórias em quadrinhos, séries de imagens e texto em redes sociais, e até para diagramas de planeamento de espaços em design de interiores de vários ambientes.

Imagem ilustrativa dos painéis de histórias em quadrinhos do anúncio oficial

Em termos de resolução, o novo modelo suporta uma saída máxima de 2K e adiciona várias opções de proporção de aspecto de 3:1 a 1:3, satisfazendo ainda melhor diversas necessidades comerciais.

Línguas asiáticas optimizadas de forma significativa: utilizadores de japonês, chinês e coreano, têm sorte!

Além do inglês, a OpenAI destacou especialmente grandes optimizações do Images 2.0 para textos asiáticos: japonês, coreano e chinês, entre outras, mostram melhorias evidentes.

Um artigo de testes divulgado há alguns dias em comunidades tecnológicas chinesas também confirmou esta notícia. Vários criadores no Zhihu realizaram na altura comparações de testes práticos entre GPT-Image-2 e o concorrente Google Nano Banana Pro, incluindo múltiplos cenários como design de cartazes em chinês, imagens de capas para e-commerce, interfaces de redes sociais e gráficos e tabelas de dados.

Teste do artigo do Zhihu ao GPT-Image 2.0

Os resultados dos testes mostram que o GPT-Image-2 supera claramente o concorrente em beleza da tipografia chinesa, níveis de paginação e sensação geral de design. Os cartazes gerados têm um estilo mais próximo de materiais comerciais reais, em vez de uma saída do tipo “modelo” com um “toque de IA” claramente perceptível. O artigo também aponta que o GPT-Image-2, na reprodução de (como cenas de jogos ou capturas de ecrã de software de comunicação) e na fidelidade de cenários com retratos reais, demonstra também uma maior precisão de detalhes.

ChatGPT Images 2.0 totalmente disponibilizado, API em sincronização

Neste momento, o ChatGPT Images 2.0 já está, desde esta terça-feira, a ser disponibilizado gratuitamente a todos os utilizadores do ChatGPT e do Codex para funcionalidades base. Os utilizadores pagantes podem desbloquear efeitos de saída mais avançados. Ao mesmo tempo, a OpenAI disponibiliza também a API do GPT-Image-2. Os preços são calculados por escalões consoante a qualidade de saída e a resolução, oferecendo flexibilidade de integração para empresas e programadores.

Importa notar que a data-limite de conhecimento do novo modelo é dezembro de 2025. Para pedidos de geração de imagens que envolvam acontecimentos noticiosos recentes, a precisão pode ser limitada até certo ponto. Além disso, a velocidade de geração de composições complexas também não consegue ser tão imediata como uma conversa normal com perguntas e respostas de texto, mas ainda assim bastam apenas alguns minutos.

Este artigo “ChatGPT Images 2.0 em destaque! A precisão da geração de texto melhora bastante, produz com facilidade cartazes de marketing” surge primeiro em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário