Anthropic 披露称,截至 2026 年 5 月,其 AI 系统 Claude 编写了超过 80% 被合并到生产系统中的代码,依据 Anthropic Institute 于 2026 年 6 月 4 日发布的报告。在 2025 年 2 月推出其内部编码代理之后,该数字有所上升,此后 Claude 的贡献率从个位数出头的比例提升。公司近期提交了保密的 IPO 注册,并将其品牌定位为围绕 AI 安全。
Claude 截至 2026 年 5 月编写了 80% 的合并代码
报告称,在 2025 年 2 月内部编码代理上线之前,Claude 仅编写了被合并代码的个位数出头比例。该占比截至 2026 年 5 月超过 80%。Anthropic 的典型工程师在 2026 年第二季度每天合并的代码量是 2024 年的八倍,同时由人工工程师进行指导和审查,而 Claude 负责编写。
该披露将 Anthropic 的内部数据与公开基准进行了配对。公司表示,2025 年下半年在 Anthropic 内部,Claude 编写的代码在某种程度上比人工编写的代码更差;截至报告日期大致持平,公司预计在当年之内会严格更好。
Mythos Preview 于 2026 年 4 月达到 52x 加速
Anthropic 对每个模型运行相同测试:向用于训练小型模型的 AI 代码提供任务,并要求其运行得更快。Claude Opus 4 在 2025 年 5 月平均实现 3x 加速。截至 2026 年 4 月,其 Mythos Preview 模型达到 52x。报告称,一名熟练的人类需要 4 到 8 小时才能达到 4x。
在研究员走错步骤之前展示的一次会话中,Mythos Preview 有 64% 的时间选择了更好的下一步,相比之下 2025 年 11 月 Opus 4.5 的比例为 51%。公司指出,Claude 目前尚未展示出研究层面的判断能力,以选择哪些问题最重要。
Anthropic 提交了保密 IPO 注册
Anthropic 最近提交了保密的 IPO 注册。公司已围绕 AI 安全打造其品牌。该报告将代码贡献趋势描述为一种可能通往递归式自我改进的路径,即 AI 构建自己的继任者,不过其也警告当前在研究判断方面的局限。
FAQ
截至 2026 年 5 月,Claude 为 Anthropic 的生产代码贡献了多少比例?
根据 2026 年 6 月 4 日的 Anthropic Institute 报告,Claude 在截至 2026 年 5 月的时间里,编写了超过 80% 被合并到 Anthropic 生产系统中的代码。这相较于 2025 年 2 月上线内部编码代理之前的个位数出头比例有所提升。
与 2024 年相比,2026 年第二季度 Anthropic 工程师合并代码快了多少?
根据报告中披露的公司内部数据,Anthropic 的典型工程师在 2026 年第二季度每天合并的代码量相当于 2024 年的八倍;在此过程中由人工工程师进行指导和审查,而 Claude 执行编写。