OpenAI lança GPT-5.5: contexto de 12M, índice AA em primeiro lugar, Terminal-Bench 82,7% reescreve o benchmark de agentes

A OpenAI divulgou oficialmente o GPT-5.5 em 23/04, posicionando-o como o modelo principal voltado para trabalho orientado a agentes (agentic) e processamento de conhecimento empresarial, ao mesmo tempo em que estreia no ChatGPT e no Codex. A publicidade oficial define como “nosso modelo mais inteligente e mais intuitivo de usar”, e o AA Intelligence Index lidera com 60 pontos, à frente do Claude Opus 4.7 e do Gemini 3.1 Pro Preview, que ficaram a 3 pontos cada.

Visão geral dos principais dados

Métrica GPT-5.5 em comparação (GPT-5.4 ou concorrentes de mesma categoria) AA Intelligence Index 60 Claude Opus 4.7:57;Gemini 3.1 Pro Preview:57 Terminal-Bench 2.0 (fluxo de trabalho via linha de comando) 82,7% GPT-5.4:75,1% Expert-SWE (avaliação interna de programação da OpenAI) 73,1% GPT-5.4:68,5% Janela de contexto 12,0 milhões de tokens grande melhora, capaz de processar o repositório inteiro de programas da empresa ou vários horas de vídeo Preço (por milhão de tokens) Entrada 5 dólares, Saída 30 dólares O dobro do preço unitário do GPT-5.4;mas o uso de tokens de saída caiu cerca de 40%, elevando o custo líquido em cerca de 20%

Posicionamento: projetado para a “Era do Agente”

A OpenAI descreve o GPT-5.5 como um modelo base para computação orientada a agentes, capaz de entender objetivos complexos, usar ferramentas, fazer autoinspeção do resultado do trabalho e executar tarefas de vários passos até a conclusão sem que humanos intervenham em cada etapa. De acordo com entrevista do TechCrunch, o presidente Greg Brockman descreveu esta versão como “um grande passo em direção à computação do futuro, mas apenas um”, enfatizando que ela “em comparação com a 5.4 é um raciocinador mais rápido e mais aguçado, usando menos tokens”.

O principal cientista Jakub Pachocki observou que “vemos melhorias bem significativas no curto prazo”; o diretor de pesquisa Mark Chen, por sua vez, destacou que esta versão trouxe “avanços significativos” no fluxo de trabalho de pesquisa científica e técnica.

Escopo de oferta e segmentação por versões

GPT-5.5:Plus, Pro, Business e Enterprise podem usar no ChatGPT e no Codex

GPT-5.5 Pro:versão de raciocínio mais avançada que usuários Pro, Business e Enterprise podem usar no ChatGPT

Integração ao Codex:disponível simultaneamente para as ferramentas de agentes de programação da OpenAI, reforçando edição multiarquivos, linha de comando e ciclos de testes

Aumenta também a retórica sobre cibersegurança e defesa

A integrante da equipe técnica Mia Glaese, em entrevista ao TechCrunch, afirmou que as capacidades de cibersegurança do GPT-5.5 terão “um impacto importante na forma como a OpenAI implantará modelos para investimento em defesa digital”. Esse discurso contrasta diretamente com as controvérsias recentes da Anthropic em torno do modelo de cibersegurança de nível armamentista Claude Mythos — Altman ainda criticou anteriormente a estratégia de “marketing do medo” da Anthropic no programa《Core Memory》. Na GPT-5.5, a OpenAI enfatiza ainda mais a narrativa de “ataque e defesa, e implantável”, com o objetivo de diferenciar-se da postura da Anthropic de limitar o acesso.

Mudança na estratégia de preços

O preço do GPT-5.5 por milhão de tokens dobra para Entrada 5 dólares e Saída 30 dólares, marcando a primeira geração da série GPT-5 em que o preço unitário aumenta de forma significativa. A explicação da OpenAI é que o modelo pode reduzir em cerca de 40% os tokens de saída no quesito eficiência de raciocínio; portanto, a fatura típica de tarefas reais fica aproximadamente 20% mais alta do que a do GPT-5.4, e não simplesmente o dobro. Para empresas, a decisão deixa de ser “se o preço vale a pena” e passa a ser “se, sob o mesmo prompt, o GPT-5.5 consegue concluir tarefas mais complexas com menos tokens no total”.

Sinal para a indústria

O GPT-5.5 amplia a diferença da OpenAI nos benchmarks Terminal-Bench e avaliações internas de SWE; esses dois benchmarks testam, respectivamente, a execução de agentes via linha de comando e tarefas reais de engenharia de software — tornando-se um campo de batalha de pontuação mais direto para confrontos positivos entre Codex e Claude Code. Somado à abertura simultânea da janela de contexto de 12,0 milhões de tokens, a OpenAI pressiona ao mesmo tempo as duas frentes: “processamento completo de bases de conhecimento empresariais” e “agentes de longas tarefas”. Para a Anthropic, o Claude Opus 4.7, com 57 pontos no índice AA, fica 3 pontos atrás; para usuários do Claude Code, há mais um motivo para observar o progresso da próxima geração (Opus 4.8 ou um novo Claude).

Este artigo sobre a OpenAI promovendo o GPT-5.5:12M de contexto, topo no índice AA, Terminal-Bench 82,7% reescreve o benchmark de agentes aparece pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

HINT (Hive Intelligence) dispara 60,25% em alta nas últimas 24 horas

Gate News 消消息, 6 de maio, segundo dados do Gate, HINT (Hive Intelligence) estava cotado em US$ 0,001695 no momento da publicação. Em 24 horas, subiu 60,25%, atingindo a máxima de US$ 0,0019 e recuando para a mínima de US$ 0,0010577. O volume de negociações em 24 horas chegou a US$ 100,1 mil. A capitalização de mercado atual é de aproximadamente US$ 781,4 mil. Hive Intelligence é a camada de infraestrutura base de agentes de IA, fornecendo uma interface de programação unificada para dados de blockchain em tempo real. Ele elimina a fragmentação de dados, permitindo que agentes de IA consultem e interajam com facilidade na cadeia. Como infraestrutura institucional para o mercado cripto, o Hive Intelligence, via endpoints MCP, REST A

GateNews1m atrás

A Anthropic lança 10 agentes de IA financeiros, integrados ao Microsoft 365 para lidar facilmente com tarefas de finanças

A Anthropic lançou 10 modelos de agentes de IA financeiros, integrando parceiros de dados como o Microsoft 365, Moody’s e D&B, e que podem ser usados como plugins ou com execução automática por agendamento. Os modelos se dividem em duas categorias: pesquisa/atendimento ao cliente e rotinas financeiras, cobrindo investimentos e pesquisa, modelos financeiros, KYC etc., além de incorporar as classificações da Moody’s. O Claude Opus 4.7 ficou em primeiro lugar nos benchmarks de agentes financeiros, indicando que os talentos do setor financeiro e o cenário regulatório serão impactados.

ChainNewsAbmedia11m atrás

Nvidia e ServiceNow expandem a parceria, apresentam o agente de desktop do Project Arc

De acordo com a Nvidia, as empresas ampliaram sua parceria esta semana para apresentar o ServiceNow Project Arc, um agente autônomo de desktop protegido pela Nvidia OpenShell e governado pela ServiceNow AI Control Tower. Os produtos têm como objetivo ajudar empresas a gerenciar e auditar agentes de IA implantados em d

GateNews30m atrás

Solana e Google Cloud lançam Pay.sh, agentes de IA podem pagar com stablecoins

De acordo com a reportagem da Decrypt em 6 de maio, a Solana Foundation está colaborando com a Google Cloud para lançar o serviço Pay.sh, que permite que agentes de IA paguem, sob demanda, custos de acesso à API usando stablecoins na Solana, sem precisar de contas tradicionais ou assinaturas; por chamada de API, o agente só precisa pagar alguns décimos de centavo de dólar, sem exigência mínima de gastos.

MarketWhisper1h atrás

A Solana Foundation e a Google Cloud lançam o gateway de pagamentos com IA Pay.sh, com suporte a mais de 50 provedores de API

De acordo com a Odaily, a Solana Foundation e a Google Cloud lançaram em conjunto a Pay.sh, uma plataforma de pagamentos com IA que permite que agentes de IA chamem serviços de API usando stablecoins on-chain em base por solicitação, sem exigir contas tradicionais. Construída sobre o protocolo x402 e compatível com Tempo e

GateNews2h atrás

Anthropic Lança 10 Agentes de IA Financeiros; Ações da FactSet Caem 8,1%

De acordo com Beating, a Anthropic lançou recentemente 10 novos agentes de IA projetados para Wall Street, com conectores e habilidades integrados para tarefas financeiras de alta frequência, incluindo redação de pitch, revisão de valuation e fluxos de conformidade. Os agentes podem ser implantados como plugins em

GateNews2h atrás
Comentário
0/400
Sem comentários