ChatGPT Images 2.0 pensa e investiga antes de criar

A OpenAI apresentou o ChatGPT Images 2.0, o seu novo modelo de geração de imagens com IA, e a principal novidade não está na resolução nem nos formatos suportados, mas na forma como o sistema processa cada pedido.

O novo modelo é alimentado pelo gpt-image-2 e integra as capacidades de raciocínio da série O da OpenAI, o que lhe permite consultar informação na web em tempo real e validar os resultados antes de os apresentar. A isto juntam-se suporte a resolução 2K, renderização de texto em múltiplos alfabetos e a possibilidade de gerar até dez variações a partir de um único prompt.

O que é o ChatGPT Images 2.0

O ChatGPT Images 2.0 é alimentado pelo modelo gpt-image-2, desenvolvido pela OpenAI com base nas capacidades de raciocínio da sua série O. Ao contrário dos geradores de imagens convencionais, que processam um pedido e produzem um resultado de forma imediata, o gpt-image-2 analisa a instrução recebida, pode consultar informação na web em tempo real e valida o resultado internamente antes de o apresentar ao utilizador.

Este processo, que a OpenAI descreve como “agêntico”, permite ao modelo lidar com pedidos complexos, com múltiplas restrições visuais, referências culturais específicas ou necessidade de precisão técnica elevada. Na prática, o resultado é um gerador de imagens com IA que produz resultados mais coerentes com a intenção original do utilizador, mesmo em prompts exigentes.

Resolução 2K e suporte a múltiplos formatos

Uma das novidades mais relevantes do ChatGPT Images 2.0 é o suporte a resolução 2K. O modelo aceita proporções que vão de 3:1 a 1:3, tornando-o adequado para casos de uso muito distintos: desde banners horizontais para sítios web e apresentações, a composições verticais para redes sociais e aplicações móveis.

Esta flexibilidade de formatos responde às necessidades de criadores de conteúdo, equipas de marketing e profissionais de design que utilizam a plataforma de forma recorrente. A qualidade da resolução 2K coloca o ChatGPT Images 2.0 num patamar competitivo com ferramentas profissionais já estabelecidas no mercado.

Renderização de texto: uma limitação finalmente endereçada

A dificuldade em reproduzir texto legível e preciso dentro de imagens geradas por IA é um problema antigo neste setor. O ChatGPT Images 2.0 aborda esta questão com uma melhoria significativa na renderização de texto integrado nas imagens, incluindo suporte a alfabetos não latinos como japonês, coreano, chinês, hindi e bengali.

Esta capacidade abre o modelo a mercados globais onde as ferramentas anteriores falhavam com frequência. Para marcas e criadores que trabalham em contextos multilingues, esta é uma das funcionalidades com maior impacto prático do novo lançamento.

Até 10 variações por prompt

O ChatGPT Images 2.0 permite gerar até oito variações de imagem a partir de um único prompt na interface do ChatGPT, número que sobe para dez quando o modelo é acedido via API. Todas as variações mantêm consistência de personagens, objetos e estilo visual, o que facilita a seleção e reutilização de elementos em projetos que exigem coerência gráfica.

Esta funcionalidade é particularmente útil para equipas criativas que precisam de testar diferentes abordagens visuais sem reformular os pedidos de raiz. A consistência entre variações reduz o tempo de revisão e aumenta a eficiência do processo criativo.

Pesquisa web em tempo real

Uma das capacidades mais inéditas do ChatGPT Images 2.0 é a possibilidade de o modelo consultar a internet antes de gerar uma imagem. Quando o pedido envolve referências a eventos recentes, marcas, locais ou contextos culturais específicos, o modelo pesquisa informação atualizada para garantir que o resultado é preciso e relevante.

Esta integração entre geração de imagens com IA e pesquisa em tempo real distingue o ChatGPT Images 2.0 de concorrentes como o Imagen 3 da Google ou o Firefly da Adobe, que não oferecem este tipo de ligação dinâmica com fontes externas.

Quem tem acesso e em que condições

O ChatGPT Images 2.0 está disponível para todos os utilizadores do ChatGPT, incluindo os planos Free e Go, embora com limitações no número de imagens geradas por dia. As funcionalidades de raciocínio visual mais avançadas, incluindo a pesquisa web em tempo real e a geração de múltiplas variações, são exclusivas dos planos Plus, Pro, Business e Enterprise.

O modelo está igualmente disponível via API da OpenAI e pelo Azure OpenAI Service, com uma estrutura de preços baseada em tokens de imagem. Esta acessibilidade via API permite a programadores e empresas integrar as capacidades do gpt-image-2 em produtos e serviços próprios.

Um lançamento anunciado no Brasil

A OpenAI escolheu o Brasil para o anúncio oficial do ChatGPT Images 2.0, uma decisão que reflete o peso do país nas métricas globais de utilização das ferramentas de imagem da empresa. O Brasil é, segundo a própria OpenAI, o mercado com maior penetração mundial no uso destas funcionalidades.

O que muda na prática

A geração de imagens com IA ChatGPT Images 2.0 não é uma atualização incremental. A combinação de raciocínio visual por inteligência artificial, resolução 2K, suporte multilingue e pesquisa em tempo real coloca este modelo numa categoria diferente dos seus antecessores. Para utilizadores comuns, o impacto é direto: resultados mais precisos e maior controlo sobre o output final. Para profissionais e empresas, o ChatGPT Images 2.0 reduz a dependência de múltiplas ferramentas para atingir o mesmo resultado.

Outros artigos interessantes:

ChatGPT Images 2.0 pensa e investiga antes de criar

Alfredo Beleza

Artigos relacionados

Google cancela a app mobile do AI Studio após 800 mil pré-registos

Inteligência artificial da Anthropic ataca três organizações por conta própria

Birdfy: O comedouro inteligente com inteligência artificial para o teu Android

Últimas notícias

Samsung Galaxy S27 Pro: nova câmara telefoto revelada antes de tempo

One UI 9.5: Samsung arranca testes no futuro Galaxy S27 Ultra

Musk nega separação da Tesla na China avançada pelo WSJ

Motorola Watch Ultra: primeiras imagens revelam design e especificações premium

Foguetão abandonado da SpaceX vai colidir contra a Lua esta semana

WhatsApp lança novo alerta para reativar o som de canais no Android

Novo design do iPad Air com ecrã OLED chega em 2027

Google Pixel Tag: A surpresa inesperada para o evento de agosto

Samsung Galaxy S27 Ultra: bateria gigante e um novo design unificado

Soundcore Sleep A30: A tua solução barata para noites tranquilas

Samsung perde milhões com smartphones apesar dos lucros nos chips

Google Pixel 11 Pro: Renders e especificações revelados antes do lançamento

Samsung testa a nova One UI 9.0 em 49 dispositivos Galaxy

Inteligência artificial da Anthropic ataca três organizações por conta própria

A Xiaomi revelou o design do Redmi K100 Pro Max

Timestamp lança divisão de Networking & Voice Solutions para operações críticas

SPC Wild Star: o telemóvel perfeito para os primeiros passos

Check Point anuncia Firewall de Segurança para IA nas redes empresariais

Microsoft recorre ao Supremo Tribunal do Reino Unido por licenças usadas

Carros à venda no Brasil: como encontrar a melhor opção no mercado atual