OpenAI lança GPT-5.5: contexto de 12M, índice AA em primeiro lugar, Terminal-Bench 82,7% reescreve o benchmark de agentes

2026-04-23 19:45:18

A OpenAI divulgou oficialmente o GPT-5.5 em 23/04, posicionando-o como o modelo principal voltado para trabalho orientado a agentes (agentic) e processamento de conhecimento empresarial, ao mesmo tempo em que estreia no ChatGPT e no Codex. A publicidade oficial define como “nosso modelo mais inteligente e mais intuitivo de usar”, e o AA Intelligence Index lidera com 60 pontos, à frente do Claude Opus 4.7 e do Gemini 3.1 Pro Preview, que ficaram a 3 pontos cada.

Visão geral dos principais dados

Métrica GPT-5.5 em comparação (GPT-5.4 ou concorrentes de mesma categoria) AA Intelligence Index 60 Claude Opus 4.7：57；Gemini 3.1 Pro Preview：57 Terminal-Bench 2.0 (fluxo de trabalho via linha de comando) 82,7% GPT-5.4：75,1% Expert-SWE (avaliação interna de programação da OpenAI) 73,1% GPT-5.4：68,5% Janela de contexto 12,0 milhões de tokens grande melhora, capaz de processar o repositório inteiro de programas da empresa ou vários horas de vídeo Preço (por milhão de tokens) Entrada 5 dólares, Saída 30 dólares O dobro do preço unitário do GPT-5.4；mas o uso de tokens de saída caiu cerca de 40%, elevando o custo líquido em cerca de 20%

Posicionamento: projetado para a “Era do Agente”

A OpenAI descreve o GPT-5.5 como um modelo base para computação orientada a agentes, capaz de entender objetivos complexos, usar ferramentas, fazer autoinspeção do resultado do trabalho e executar tarefas de vários passos até a conclusão sem que humanos intervenham em cada etapa. De acordo com entrevista do TechCrunch, o presidente Greg Brockman descreveu esta versão como “um grande passo em direção à computação do futuro, mas apenas um”, enfatizando que ela “em comparação com a 5.4 é um raciocinador mais rápido e mais aguçado, usando menos tokens”.

O principal cientista Jakub Pachocki observou que “vemos melhorias bem significativas no curto prazo”; o diretor de pesquisa Mark Chen, por sua vez, destacou que esta versão trouxe “avanços significativos” no fluxo de trabalho de pesquisa científica e técnica.

Escopo de oferta e segmentação por versões

GPT-5.5：Plus, Pro, Business e Enterprise podem usar no ChatGPT e no Codex

GPT-5.5 Pro：versão de raciocínio mais avançada que usuários Pro, Business e Enterprise podem usar no ChatGPT

Integração ao Codex：disponível simultaneamente para as ferramentas de agentes de programação da OpenAI, reforçando edição multiarquivos, linha de comando e ciclos de testes

Aumenta também a retórica sobre cibersegurança e defesa

A integrante da equipe técnica Mia Glaese, em entrevista ao TechCrunch, afirmou que as capacidades de cibersegurança do GPT-5.5 terão “um impacto importante na forma como a OpenAI implantará modelos para investimento em defesa digital”. Esse discurso contrasta diretamente com as controvérsias recentes da Anthropic em torno do modelo de cibersegurança de nível armamentista Claude Mythos — Altman ainda criticou anteriormente a estratégia de “marketing do medo” da Anthropic no programa《Core Memory》. Na GPT-5.5, a OpenAI enfatiza ainda mais a narrativa de “ataque e defesa, e implantável”, com o objetivo de diferenciar-se da postura da Anthropic de limitar o acesso.

Mudança na estratégia de preços

O preço do GPT-5.5 por milhão de tokens dobra para Entrada 5 dólares e Saída 30 dólares, marcando a primeira geração da série GPT-5 em que o preço unitário aumenta de forma significativa. A explicação da OpenAI é que o modelo pode reduzir em cerca de 40% os tokens de saída no quesito eficiência de raciocínio; portanto, a fatura típica de tarefas reais fica aproximadamente 20% mais alta do que a do GPT-5.4, e não simplesmente o dobro. Para empresas, a decisão deixa de ser “se o preço vale a pena” e passa a ser “se, sob o mesmo prompt, o GPT-5.5 consegue concluir tarefas mais complexas com menos tokens no total”.

Sinal para a indústria

O GPT-5.5 amplia a diferença da OpenAI nos benchmarks Terminal-Bench e avaliações internas de SWE; esses dois benchmarks testam, respectivamente, a execução de agentes via linha de comando e tarefas reais de engenharia de software — tornando-se um campo de batalha de pontuação mais direto para confrontos positivos entre Codex e Claude Code. Somado à abertura simultânea da janela de contexto de 12,0 milhões de tokens, a OpenAI pressiona ao mesmo tempo as duas frentes: “processamento completo de bases de conhecimento empresariais” e “agentes de longas tarefas”. Para a Anthropic, o Claude Opus 4.7, com 57 pontos no índice AA, fica 3 pontos atrás; para usuários do Claude Code, há mais um motivo para observar o progresso da próxima geração (Opus 4.8 ou um novo Claude).

Este artigo sobre a OpenAI promovendo o GPT-5.5：12M de contexto, topo no índice AA, Terminal-Bench 82,7% reescreve o benchmark de agentes aparece pela primeira vez em 鏈新聞 ABMedia.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

04-23 14:41

OpenClaw 2026.4.22 Unifica o Ciclo de Vida do Plugin entre os Harnesses do Codex e do Pi, Reduz o Tempo de Carregamento do Plugin em Até 90%

04-23 09:02

GoPlus AgentGuard lança modo Checkup para fortalecer a segurança Web3 de agentes de IA

04-23 08:32

OpenAI Lança Agentes de Workspace do ChatGPT para Automação de Fluxos de Trabalho na Empresa

O Google Jules divulga uma lista de possíveis nomes do novo lançamento aberto e a reposiciona como uma plataforma de desenvolvimento de produtos ponta a ponta

Market Whisper04-23 06:13

Modelos de segurança no nível de armamento da Anthropic Mythos sofreram acesso não autorizado: como eles conseguiram fazer isso?

ChainNewsAbmedia04-23 03:33

Agentes do ChatGPT Workspace da OpenAI: movidos por Codex, compartilhamento em equipe, integração com o Slack

ChainNewsAbmedia04-23 02:55

Google Cloud Next 2026: lança a plataforma de agentes corporativos Gemini, US$ 750 milhões para ajudar consultorias a colocar soluções em prática

ChainNewsAbmedia04-23 02:54

Imagens do ChatGPT 2.0 lançadas! Acurácia na geração de texto melhora significativamente, produzindo facilmente pôsteres de marketing

ChainNewsAbmedia04-22 04:24

Comentário

0/400

Sem comentários