Avaliação da AISI: a capacidade de ataque cibernético da GPT-5.5 está no mesmo nível que a da Anthropic Mythos

2026-05-02 03:16:50

O Instituto de Segurança de IA do Reino Unido (AI Security Institute, AISI) publicou em 1º de maio um relatório de avaliação sobre a capacidade de ataques cibernéticos do OpenAI GPT-5.5, indicando que a taxa de sucesso do GPT-5.5 nos testes de dificuldade Expert foi de 71,4%, enquanto a do Anthropic Claude Mythos Preview foi de 68,6%; a diferença ficou dentro da margem de erro estatístico. O GPT-5.5 também é o segundo sistema de IA, depois do Mythos, capaz de concluir de forma autônoma os 32 passos do AISI “The Last Ones”, simulando uma intrusão corporativa completa na rede. O AISI alerta que isso mostra que o rápido avanço nas capacidades de ataques por IA pode ser parte de uma “tendência geral”, e não um único evento de ruptura.

Testes de dificuldade Expert: 71,4% vs 68,6%, diferença dentro do erro

O AISI é uma instituição de pesquisa em segurança de IA vinculada ao Departamento de Ciência, Inovação e Tecnologia do Reino Unido. Esta rodada de testes é a avaliação mais recente do AISI sobre capacidades cibernéticas ofensivas de modelos de IA de ponta (frontier). Nas questões de maior dificuldade Expert, a taxa média de sucesso do GPT-5.5 foi de 71,4%, e a do Mythos Preview, de 68,6%; a diferença entre os dois ficou dentro da margem de erro estatístico, indicando que, no momento, as capacidades ofensivas dos principais modelos da OpenAI e da Anthropic já estão praticamente empatadas.

O teste de simulação de invasão de rede corporativa em 32 etapas “The Last Ones” é um dos itens de avaliação mais desafiadores do AISI: o GPT-5.5 concluiu 2 vezes em 10 tentativas de forma autônoma (sem intervenção humana), enquanto o Mythos Preview concluiu 3 vezes em 10. No passado, apenas o Mythos havia conseguido concluir esse projeto; o GPT-5.5 é o segundo modelo a atingir a meta. Em outro teste, o GPT-5.5 resolveu uma questão de engenharia reversa em cerca de 10 minutos, enquanto especialistas humanos de segurança levaram em média 12 horas.

Jailbreak universal: em 6 horas, o time de red consegue contornar todos os filtros de consultas maliciosas

Pesquisadores do AISI também identificaram um vetor de ataque de “universal jailbreak” (jailbreak universal): em todas as categorias de consultas de rede maliciosas testadas, esse ataque consegue induzir o GPT-5.5 a gerar conteúdo prejudicial, incluindo cenários de diálogo agentic em múltiplas rodadas. O AISI afirma que especialistas do time de red levaram cerca de 6 horas para desenvolver esse jailbreak.

Para a OpenAI, a existência desse universal jailbreak significa que, mesmo se o GPT-5.5-Cyber for implantado em cenários de acesso restrito, como o programa de trusted access, ainda pode ser contornado por adversários tecnicamente habilidosos. A OpenAI já revelou, na system card do GPT-5.5, avaliações relacionadas à segurança cibernética; mas a avaliação independente de terceiro do AISI oferece um referencial de pares mais confiável.

Observações futuras: cronograma da próxima avaliação do AISI e resposta da OpenAI ao jailbreak

O próximo ponto de observação é o cronograma do AISI para a próxima avaliação de modelos de ponta (frontier) depois do Mythos e do GPT-5.5, bem como se a OpenAI publicará atualizações direcionadas em maio para enfrentar o universal jailbreak divulgado nesta ocasião. Nas conclusões do relatório, o AISI afirma de forma clara: “se capacidades cibernéticas ofensivas forem um subproduto de melhorias mais amplas em raciocínio, codificação e tarefas autônomas, os avanços futuros podem chegar em um ritmo mais acelerado” — essa observação sugere que, nos próximos meses, talvez mais modelos de ponta ingressem no nível “Mythos”.

Este artigo AVALIAÇÃO do AISI: capacidade de ataque cibernético do GPT-5.5 e equivalência com o Anthropic Mythos aparece primeiro no site Cadeia Notícias ABMedia.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

05-01 11:11

Nebius concorda em adquirir a Eigen AI por $643M em dinheiro e ações

05-01 02:09

A Anthropic lança o beta de segurança do Claude para usuários empresariais em 1º de maio

04-30 23:33

OpenClaw Lança a versão v2026.4.29 em 29 de abril, Atualiza a memória para um Wiki personalizado com rastreamento de relacionamento

Pentágono assina contratos confidenciais de implantação de rede militar com 7 empresas de IA: Anthropic ainda excluída

ChainNewsAbmedia05-02 03:15

Diretor de tecnologia do Pentágono: a Anthropic ainda está na lista negra, tratamento de exceção para a Mythos

ChainNewsAbmedia05-01 12:19

Você pergunta ao Claude “assuntos importantes da vida” e, quando ele sai com: problemas emocionais 25%, espiritualidade 38% adulação