根據 Anthropic 的官方公告,公司確認將在安全防禦機制取得突破性進展後的數週內,向所有客戶發布下一代 Mythos 級模型。該公告是在 5 月 22 日之後發布,當時 Glasswing 軟體安全計畫的報告強調,公司不會在更強健的安全防禦機制開發完成前公開發布 Mythos 級模型。
由於攻防能力存在顯著的時間落差,Mythos 級模型面臨部署延遲:漏洞可能在數秒內被發現,但修補則需要數週。Anthropic 正在加速開發強化的安全防禦系統,並已開始向合格的安全團隊提供防禦式掃描工具,以在威脅緩解上建立非對稱優勢。