Évaluation AISI : les capacités de cyberattaque de GPT-5.5 sont à égalité avec celles d’Anthropic Mythos

L’Institute britannique pour la sécurité de l’IA (AI Security Institute, AISI) a publié le 1er mai un rapport d’évaluation des capacités d’attaque par le réseau de OpenAI GPT-5.5, indiquant que le taux de réussite de GPT-5.5 aux tests de difficulté Expert est de 71,4%, et celui d’Anthropic Claude Mythos Preview de 68,6%, l’écart restant dans la marge d’erreur statistique. GPT-5.5 est aussi, après Mythos, le deuxième système d’IA capable de réaliser en autonomie les 32 étapes de la simulation d’intrusion complète par le réseau d’entreprise de « The Last Ones ». L’AISI avertit que cela montre que les progrès rapides des capacités d’attaque par l’IA pourraient faire partie d’une « tendance globale », plutôt que d’un événement de percée unique.

Difficulté Expert : 71,4% vs 68,6%, écart dans la marge d’erreur

L’AISI est un organisme de recherche sur la sécurité de l’IA relevant du ministère britannique des sciences, de l’innovation et de la technologie. Cette série de tests constitue la dernière évaluation de l’AISI sur les capacités d’attaque par le réseau des modèles frontier. Dans les questions de difficulté Expert les plus élevées, le taux de réussite moyen de GPT-5.5 est de 71,4%, contre 68,6% pour Mythos Preview ; l’écart entre les deux se situe dans la marge d’erreur statistique, ce qui signifie que les capacités d’attaque des modèles phares d’OpenAI et d’Anthropic sont désormais effectivement au même niveau.

Le test d’intrusion simulée d’un réseau d’entreprise en 32 étapes « The Last Ones » est l’un des volets d’évaluation les plus difficiles de l’AISI : GPT-5.5 a réussi à accomplir en autonomie 2 fois sur 10 essais (sans intervention humaine), tandis que Mythos Preview a réussi 3 fois sur 10. Ce projet n’a été réalisé auparavant que par Mythos ; GPT-5.5 est donc le deuxième modèle à atteindre le niveau requis. Lors d’un autre test, GPT-5.5 a réussi à résoudre un problème d’ingénierie inverse en environ 10 minutes, alors que les experts humains en sécurité ont en moyenne besoin de 12 heures.

Universal jailbreak : en 6 heures, le red team peut contourner tous les filtres de requêtes malveillantes

Les chercheurs de l’AISI ont également identifié un vecteur d’attaque « universal jailbreak » (jailbreak universel) : dans toutes les catégories de requêtes malveillantes testées, cette attaque peut amener GPT-5.5 à produire du contenu nuisible, y compris dans des scénarios de dialogue agentic sur plusieurs tours. L’AISI indique que les experts du red team ont mis environ 6 heures pour développer ce jailbreak.

Pour OpenAI, la présence de ce universal jailbreak signifie que même si GPT-5.5-Cyber est déployé dans des scénarios à accès limité, tels que le programme trusted access, il pourrait encore être contourné par des adversaires techniquement compétents. OpenAI a déjà divulgué, dans la system card de GPT-5.5, des évaluations liées à la cybersécurité, mais l’évaluation indépendante de l’AISI apporte des critères de référence plus crédibles au niveau des pairs.

Observations à venir : calendrier de la prochaine évaluation de l’AISI, et réponse d’OpenAI au jailbreak

Le prochain point d’observation est le calendrier de la prochaine évaluation des modèles frontier après Mythos et GPT-5.5 par l’AISI, ainsi que la question de savoir si OpenAI publiera des mises à jour ciblées en mai pour répondre à ce universal jailbreak divulgué. Dans la conclusion de son rapport, l’AISI indique clairement : « si les capacités d’attaque par réseau sont un sous-produit d’améliorations plus générales du raisonnement, du codage et de l’exécution de tâches autonomes, les progrès ultérieurs pourraient arriver à un rythme plus rapide » — cette observation laisse entendre que, dans les mois à venir, des modèles frontier pourraient encore franchir à nouveau le seuil « niveau Mythos ».

Cet article, évaluation de l’AISI : capacités d’attaque par le réseau de GPT-5.5 au niveau de Mythos d’Anthropic, est apparu pour la première fois sur la chaîne ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire