Anthropic 今天發布 Claude Opus 4.8,在 Opus 4.7 的基礎上提供更強的基準測試表現與改進的代理(agentic)能力。新模型可立即使用,且價格相同:輸入 token 每 100 萬 5 美元,輸出 token 每 100 萬 25 美元。此番推出在 claude.ai 與 Cowork 上新增了「努力控制」(effort controls),讓使用者可調整 Claude 在回覆中投入多少推理;設定越高,答案越強,設定越低則優先速度。
Claude Code 現在提供用於處理複雜任務的動態工作流程,包括可協調數百個平行子代理(subagents)。早期測試者發現 Opus 4.8 在代理任務上更可靠,內部評估顯示,它相較於 Opus 4.7 大約低四倍機率會漏掉程式碼缺陷。以 2.5 倍正常速度運行的 Opus 4.8 快速模式,現在成本是先前版本的三分之一。