Avaliação da AISI: a capacidade de ataque cibernético da GPT-5.5 está no mesmo nível que a da Anthropic Mythos

ChainNewsAbmedia

O Instituto de Segurança de IA do Reino Unido (AI Security Institute, AISI) publicou em 1º de maio um relatório de avaliação sobre a capacidade de ataques cibernéticos do OpenAI GPT-5.5, indicando que a taxa de sucesso do GPT-5.5 nos testes de dificuldade Expert foi de 71,4%, enquanto a do Anthropic Claude Mythos Preview foi de 68,6%; a diferença ficou dentro da margem de erro estatístico. O GPT-5.5 também é o segundo sistema de IA, depois do Mythos, capaz de concluir de forma autônoma os 32 passos do AISI “The Last Ones”, simulando uma intrusão corporativa completa na rede. O AISI alerta que isso mostra que o rápido avanço nas capacidades de ataques por IA pode ser parte de uma “tendência geral”, e não um único evento de ruptura.

Testes de dificuldade Expert: 71,4% vs 68,6%, diferença dentro do erro

O AISI é uma instituição de pesquisa em segurança de IA vinculada ao Departamento de Ciência, Inovação e Tecnologia do Reino Unido. Esta rodada de testes é a avaliação mais recente do AISI sobre capacidades cibernéticas ofensivas de modelos de IA de ponta (frontier). Nas questões de maior dificuldade Expert, a taxa média de sucesso do GPT-5.5 foi de 71,4%, e a do Mythos Preview, de 68,6%; a diferença entre os dois ficou dentro da margem de erro estatístico, indicando que, no momento, as capacidades ofensivas dos principais modelos da OpenAI e da Anthropic já estão praticamente empatadas.

O teste de simulação de invasão de rede corporativa em 32 etapas “The Last Ones” é um dos itens de avaliação mais desafiadores do AISI: o GPT-5.5 concluiu 2 vezes em 10 tentativas de forma autônoma (sem intervenção humana), enquanto o Mythos Preview concluiu 3 vezes em 10. No passado, apenas o Mythos havia conseguido concluir esse projeto; o GPT-5.5 é o segundo modelo a atingir a meta. Em outro teste, o GPT-5.5 resolveu uma questão de engenharia reversa em cerca de 10 minutos, enquanto especialistas humanos de segurança levaram em média 12 horas.

Jailbreak universal: em 6 horas, o time de red consegue contornar todos os filtros de consultas maliciosas

Pesquisadores do AISI também identificaram um vetor de ataque de “universal jailbreak” (jailbreak universal): em todas as categorias de consultas de rede maliciosas testadas, esse ataque consegue induzir o GPT-5.5 a gerar conteúdo prejudicial, incluindo cenários de diálogo agentic em múltiplas rodadas. O AISI afirma que especialistas do time de red levaram cerca de 6 horas para desenvolver esse jailbreak.

Para a OpenAI, a existência desse universal jailbreak significa que, mesmo se o GPT-5.5-Cyber for implantado em cenários de acesso restrito, como o programa de trusted access, ainda pode ser contornado por adversários tecnicamente habilidosos. A OpenAI já revelou, na system card do GPT-5.5, avaliações relacionadas à segurança cibernética; mas a avaliação independente de terceiro do AISI oferece um referencial de pares mais confiável.

Observações futuras: cronograma da próxima avaliação do AISI e resposta da OpenAI ao jailbreak

O próximo ponto de observação é o cronograma do AISI para a próxima avaliação de modelos de ponta (frontier) depois do Mythos e do GPT-5.5, bem como se a OpenAI publicará atualizações direcionadas em maio para enfrentar o universal jailbreak divulgado nesta ocasião. Nas conclusões do relatório, o AISI afirma de forma clara: “se capacidades cibernéticas ofensivas forem um subproduto de melhorias mais amplas em raciocínio, codificação e tarefas autônomas, os avanços futuros podem chegar em um ritmo mais acelerado” — essa observação sugere que, nos próximos meses, talvez mais modelos de ponta ingressem no nível “Mythos”.

Este artigo AVALIAÇÃO do AISI: capacidade de ataque cibernético do GPT-5.5 e equivalência com o Anthropic Mythos aparece primeiro no site Cadeia Notícias ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários