De acordo com Beating, a Anthropic colocou indefinidamente de lado o Claude Mythos Preview, o seu mais recente modelo com foco em segurança, citando riscos significativos de cibersegurança antes de avançar para mecanismos de alinhamento mais fortes.
Durante red-teaming colaborativo realizado ao longo do último mês, com cerca de 50 parceiros, incluindo Microsoft, Oracle, Cloudflare e Mozilla, o modelo identificou mais de 10.000 vulnerabilidades de zero-day de alta ou criticidade em infraestruturas críticas a nível global. A Mozilla, por si só, identificou 271 vulnerabilidades no Firefox usando o Mythos Preview, o que representa uma melhoria de dez vezes face ao Claude Opus 4.6. O UK AI Safety Institute avaliou o Mythos Preview como o primeiro modelo a comprometer totalmente todos os cenários simulados de ataque à rede. A Anthropic concluiu que o lançamento público reduziria significativamente as barreiras para o desenvolvimento de malware e para ciberataques, colocando riscos catastróficos para a infraestruturas de internet e software a nível global.