Anthropic prévoit l’expansion de l’IA Claude Mythos après des tests de cybersécurité

Anthropic a annoncé jeudi qu’elle s’attend à élargir l’accès à son modèle d’IA Claude Mythos « dans les prochaines semaines », après avoir terminé des tests supplémentaires de garanties. La société a fait cette annonce en parallèle du lancement de son nouveau modèle Opus 4.8, offrant son indication la plus claire à ce jour d’une disponibilité plus large pour ce système orienté cybersécurité. Anthropic a restreint l’accès à Mythos via Project Glasswing depuis mars, après des alertes de chercheurs et d’agences gouvernementales concernant des capacités d’attaque cyberautonome du modèle. L’annonce intervient au milieu d’un débat plus large au sein de l’industrie de l’IA sur la façon dont des systèmes avancés dotés de capacités de sécurité offensive devraient être déployés auprès des clients.

Current Access Restrictions

Anthropic a limité la diffusion de Claude Mythos via Project Glasswing, un programme donnant à certaines entreprises technologiques, des chercheurs en sécurité et des partenaires gouvernementaux un accès dans des conditions contrôlées. La société a d’abord décrit Mythos dans des documents de blog de mars divulgués comme « le modèle d’IA le plus puissant que nous ayons jamais développé », le positionnant comme un niveau au-dessus de ses modèles Opus. Anthropic a déclaré que le modèle « annonce une prochaine vague de modèles capables d’exploiter des vulnérabilités d’une manière qui dépasse largement les efforts des défenseurs ». La société n’a pas précisé quelles garanties restent incomplètes avant un déploiement plus large, ni si tous les clients recevront des niveaux d’accès identiques. Anthropic n’a pas répondu aux demandes de commentaires concernant les détails de mise en œuvre.

Documented Technical Capabilities

L’U.K.’s AI Security Institute a constaté que Mythos avait achevé de manière autonome une attaque simulée de réseau d’entreprise en 32 étapes au cours des tests. En avril, Mozilla a rapporté que Mythos avait identifié 271 vulnérabilités dans Firefox lors d’évaluations internes de sécurité. Plus tôt ce mois-ci, le jeune pousse de cybersécurité Calif a déclaré qu’une version d’aperçu avait aidé des chercheurs à développer une chaîne d’exploitation visant les puces M5 des Mac d’Apple. Anthropic a fait valoir que Mythos pourrait aider les défenseurs à identifier et corriger des vulnérabilités logicielles avant que des attaquants ne les exploitent. Des chercheurs en sécurité et des agences gouvernementales ont averti que les mêmes capacités pourraient accélérer les cyberattaques.

Industry Debate Over Release Strategy

Le modèle est devenu central dans les discussions au sein de l’industrie de l’IA concernant la mise à disposition de systèmes avancés. Lors d’un entretien de mai avec le podcast « Core Memory », le PDG d’OpenAI, Sam Altman, a accusé Anthropic d’utiliser un « marketing basé sur la peur », estimant que les avertissements concernant les risques en cybersécurité pourraient justifier la limitation de l’accès à des systèmes d’IA puissants. Les utilisateurs sur Myriad—a plateforme de marché de prédiction exploitée par la société mère de Decrypt, Dastan—ont accordé une probabilité de 44 % à un déploiement de Mythos d’ici la fin juin au jeudi, contre 17,5 % ce matin-là.

Confirmed Next Steps

Anthropic a déclaré qu’elle « progresse rapidement dans le développement de ces garanties » et s’attend à mettre « les modèles de la classe Mythos à la disposition de tous nos clients dans les prochaines semaines ».

FAQ

What is Project Glasswing? Project Glasswing est le programme d’accès restreint d’Anthropic qui fournit à certaines entreprises technologiques, des chercheurs en sécurité et des partenaires gouvernementaux un accès contrôlé au modèle Claude Mythos dans des conditions spécifiques.

What vulnerabilities has Mythos identified in testing? Mozilla a rapporté que Mythos avait identifié 271 vulnérabilités dans Firefox lors d’évaluations internes de sécurité en avril. L’U.K.’s AI Security Institute a documenté que le modèle avait achevé de manière autonome une attaque simulée de réseau d’entreprise en 32 étapes. Le jeune pousse de cybersécurité Calif a déclaré qu’une version d’aperçu avait aidé à développer une chaîne d’exploitation visant les puces M5 des Mac d’Apple.

When did Anthropic first announce Mythos? Claude Mythos a d’abord fait surface en mars après la fuite en ligne de documents de brouillon de blog d’Anthropic. La société l’a décrit comme « le modèle d’IA le plus puissant que nous ayons jamais développé » et l’a positionné comme un nouveau niveau au-dessus de ses modèles Opus.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire