据《金融时报》周四报道,Anthropic 已在美国国家安全局嵌入了大约 6 名工程师,以部署其 Mythos AI 模型用于进攻性网络操作。这些工程师正在为特定应用定制该模型,潜在用途可能包括渗透中国和伊朗的网络,据《金融时报》引用的消息人士称。此次部署发生在 Anthropic 同时发布研究,呼吁对 AI 开发采取协调一致的全球暂停机制,并递交了可能使公司估值超过 10 亿亿美元的首次公开募股申请。
Anthropic 为 Mythos AI 行动在 NSA 安置工程师
根据《金融时报》的报道,Anthropic 已在美国国家安全局内部放置约 6 名工程师,以帮助部署其最强大的 AI 模型 Mythos,用于进攻性网络行动。工程师为前线派驻人员,负责针对特定应用定制该模型。一位消息人士告诉《金融时报》,该模型或可用于渗透中国和伊朗等国家的网络。
Mythos 是 Anthropic 曾拒绝公开发布的同一款模型,理由是存在被滥用风险。公司通过 Project Glasswing 将其限制在经过审查的合作伙伴范围内——这是一个受限联盟,包含 Microsoft、Apple 和 Amazon。目前尚不确认这些工程师是否参与了实际行动。
Anthropic 就供应链风险认定起诉五角大楼
在去年 2 月下旬,国防部长 Pete Hegseth 将该公司认定为供应链风险后,Anthropic 正在起诉五角大楼——这一标签历史上通常仅保留给华为等外国对手。该认定发生在一份价值 2 亿美元的合同崩溃之后。关键点在于:Anthropic 拒绝允许国防部将 Claude 用于完全自主武器或国内大规模监控。NSA 合同不在该禁令范围内。
一名加州法官以疑似言论自由权报复为由,阻止了黑名单认定。一个 D.C. 上诉法院驳回了 Anthropic 在诉讼期间中止该认定的请求。据《金融时报》报道,在此期间 NSA 继续使用 Mythos。五角大楼要求从其系统中移除 Claude 的最后期限为 8 月。
Claude 编写了超过 80% 的 Anthropic 生产代码
就在 NSA 相关报道曝出同一天,Anthropic 的内部研究机构发布了《When AI Builds Itself》,探讨 Claude 在自动化自身研发方面已经走到了多远。Claude 现在编写的代码超过了并入 Anthropic 生产代码库的 80%——而在 Claude Code 于 2025 年初上线之前,这一比例还只有个位数以下。根据 Anthropic 的说法,工程师每天交付的代码量大约是 2024 年的 8 倍。
在 4 月,Claude 代理被交付了一个开放式 AI 安全问题——较弱的模型能否可靠地监督较强的模型——并被让其自行运行该任务。两名人类研究人员在大约一周内缩小了两种模型之间 23% 的性能差距。代理在累计 800 小时计算量内实现了 97% 的恢复。人类提出了问题,而代理设计了每一项实验。报告作者——Anthropic Institute 负责人 Marina Favaro 和联合创始人 Jack Clark——将其描述为 Claude 进行研究判断的首个已发表案例,而不仅仅是执行他人指定的任务。
Anthropic 提议可核验的全球 AI 开发暂停
该报告主张进行可核验的全球暂停——多个前沿实验室同时停止,并由独立核验确保每个人确实都停了。Anthropic 表示将加入这样的暂停。作者将所提议机制类比为美俄之间在冷战时期达成的核裁军条约。
Anthropic 警告称,这条路径正在走向递归式自我改进:AI 系统能够自主设计、构建并训练自身的后继者,而在每一步中人类扮演的角色将逐步减少。报告称,一旦 AI 选择哪些实验值得运行——不只是运行它们——人类就会在开发回路中失去最后一项具有意义的角色。如今模型中可见的小幅错配,可能会在自我改进的代际中不断累积,直到无人能够纠正它们。
2023 年发出的 AI 安全警告未能阻止开发
在 2023 年,AI 研究领域的上百位重要人士签署了一封公开信,呼吁开展一项全球性努力,以降低 AI 开发本身固有的灭绝风险。此前几个月,另一封公开信要求 OpenAI 暂停推进与 ChatGPT 相关的进展,原因是其具有危险性。此后没有人因为 2023 年的公开信而停止。OpenAI 没有,Anthropic 也没有。
常见问题
Anthropic 在 NSA 部署了什么?
据《金融时报》周四发布的报道,Anthropic 在美国国家安全局嵌入了大约 6 名工程师,以部署其 Mythos AI 模型用于进攻性网络操作。这些工程师正在为特定应用定制该模型,潜在用途可能包括渗透中国和伊朗的网络。
Anthropic 为何要起诉五角大楼?
在去年 2 月下旬、价值 2 亿美元合同崩溃之后,国防部长 Pete Hegseth 将该公司认定为供应链风险,Anthropic 因此正在起诉五角大楼。Anthropic 拒绝允许国防部将 Claude 用于完全自主武器或国内大规模监控。加州一名法官以疑似言论自由权报复为由阻止了黑名单认定,而 D.C. 上诉法院驳回了 Anthropic 在诉讼期间中止该认定的请求。
Claude 为 Anthropic 编写多少代码?
Claude 现在编写的代码占并入 Anthropic 生产代码库的比例超过 80%——而在 2025 年初 Claude Code 上线之前,这一比例还只有个位数以下。根据 Anthropic 的《When AI Builds Itself》报告(由该公司内部研究机构发布),工程师每天交付的代码量大约是 2024 年的 8 倍。