Évaluation AISI : les capacités de cyberattaque de GPT-5.5 sont à égalité avec celles d’Anthropic Mythos

2026-05-02 03:16:50

L’Institute britannique pour la sécurité de l’IA (AI Security Institute, AISI) a publié le 1er mai un rapport d’évaluation des capacités d’attaque par le réseau de OpenAI GPT-5.5, indiquant que le taux de réussite de GPT-5.5 aux tests de difficulté Expert est de 71,4%, et celui d’Anthropic Claude Mythos Preview de 68,6%, l’écart restant dans la marge d’erreur statistique. GPT-5.5 est aussi, après Mythos, le deuxième système d’IA capable de réaliser en autonomie les 32 étapes de la simulation d’intrusion complète par le réseau d’entreprise de « The Last Ones ». L’AISI avertit que cela montre que les progrès rapides des capacités d’attaque par l’IA pourraient faire partie d’une « tendance globale », plutôt que d’un événement de percée unique.

Difficulté Expert : 71,4% vs 68,6%, écart dans la marge d’erreur

L’AISI est un organisme de recherche sur la sécurité de l’IA relevant du ministère britannique des sciences, de l’innovation et de la technologie. Cette série de tests constitue la dernière évaluation de l’AISI sur les capacités d’attaque par le réseau des modèles frontier. Dans les questions de difficulté Expert les plus élevées, le taux de réussite moyen de GPT-5.5 est de 71,4%, contre 68,6% pour Mythos Preview ; l’écart entre les deux se situe dans la marge d’erreur statistique, ce qui signifie que les capacités d’attaque des modèles phares d’OpenAI et d’Anthropic sont désormais effectivement au même niveau.

Le test d’intrusion simulée d’un réseau d’entreprise en 32 étapes « The Last Ones » est l’un des volets d’évaluation les plus difficiles de l’AISI : GPT-5.5 a réussi à accomplir en autonomie 2 fois sur 10 essais (sans intervention humaine), tandis que Mythos Preview a réussi 3 fois sur 10. Ce projet n’a été réalisé auparavant que par Mythos ; GPT-5.5 est donc le deuxième modèle à atteindre le niveau requis. Lors d’un autre test, GPT-5.5 a réussi à résoudre un problème d’ingénierie inverse en environ 10 minutes, alors que les experts humains en sécurité ont en moyenne besoin de 12 heures.

Universal jailbreak : en 6 heures, le red team peut contourner tous les filtres de requêtes malveillantes

Les chercheurs de l’AISI ont également identifié un vecteur d’attaque « universal jailbreak » (jailbreak universel) : dans toutes les catégories de requêtes malveillantes testées, cette attaque peut amener GPT-5.5 à produire du contenu nuisible, y compris dans des scénarios de dialogue agentic sur plusieurs tours. L’AISI indique que les experts du red team ont mis environ 6 heures pour développer ce jailbreak.

Pour OpenAI, la présence de ce universal jailbreak signifie que même si GPT-5.5-Cyber est déployé dans des scénarios à accès limité, tels que le programme trusted access, il pourrait encore être contourné par des adversaires techniquement compétents. OpenAI a déjà divulgué, dans la system card de GPT-5.5, des évaluations liées à la cybersécurité, mais l’évaluation indépendante de l’AISI apporte des critères de référence plus crédibles au niveau des pairs.

Observations à venir : calendrier de la prochaine évaluation de l’AISI, et réponse d’OpenAI au jailbreak

Le prochain point d’observation est le calendrier de la prochaine évaluation des modèles frontier après Mythos et GPT-5.5 par l’AISI, ainsi que la question de savoir si OpenAI publiera des mises à jour ciblées en mai pour répondre à ce universal jailbreak divulgué. Dans la conclusion de son rapport, l’AISI indique clairement : « si les capacités d’attaque par réseau sont un sous-produit d’améliorations plus générales du raisonnement, du codage et de l’exécution de tâches autonomes, les progrès ultérieurs pourraient arriver à un rythme plus rapide » — cette observation laisse entendre que, dans les mois à venir, des modèles frontier pourraient encore franchir à nouveau le seuil « niveau Mythos ».

Cet article, évaluation de l’AISI : capacités d’attaque par le réseau de GPT-5.5 au niveau de Mythos d’Anthropic, est apparu pour la première fois sur la chaîne ABMedia.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

05-01 11:11

Nebius accepte d’acquérir Eigen AI pour $643M en numéraire et en actions

05-01 02:09

Anthropic ouvre la version bêta de la sécurité de Claude pour les utilisateurs professionnels le 1er mai

04-30 23:33

OpenClaw publie la version v2026.4.29 le 29 avril et met à niveau la mémoire vers un wiki personnalisé avec suivi des relations