Anthropic 於 7 月 1 日發布 Claude Sonnet 5,並將其設為 Free 與 Pro 用戶的預設模型。API 標準定價為每百萬 token 輸入 3 美元、輸出 15 美元,8 月 31 日前優惠期定價為輸入 2 美元、輸出 10 美元;對比旗艦 Opus 4.8 標準定價便宜約六成。
Claude Sonnet 5 的 API 定價、優惠期限與 tokenizer 說明
Claude Sonnet 5 的 context window 上限為 100 萬 token,最大輸出達 128k token。此版本採用更新版 tokenizer,Anthropic 說明相同輸入在新 tokenizer 下產生的 token 數量為前代的 1.0 至 1.35 倍,視內容而定。Anthropic 聲稱定價已調整為「大致成本中性」,並建議高流量用戶自行執行基準測試以評估實際帳單影響。
Anthropic 公布的 6 項基準測試數據
以下數據均來自 Anthropic 官方,尚未有第三方獨立驗證報告:
SWE-bench Pro(agentic 程式碼):Sonnet 5 63.2%,Opus 4.8 69.2%,Sonnet 4.6 58.1%
Terminal-Bench 2.1(終端機操控):Sonnet 5 80.4%,Opus 4.8 82.7%
Humanity's Last Exam(多學科推理,搭配工具):Sonnet 5 57.4%,Opus 4.8 57.9%
GDPval-AA v2(知識工作):Sonnet 5 得分 1,618;Opus 4.8 得分 1,615
OSWorld-Verified(電腦操控):Sonnet 5 81.2%,Sonnet 4.6 78.5%
Firefox 147 漏洞評估:Sonnet 5 可用漏洞產出率 0%,部分成功率 13.2%;Sonnet 4.6 部分成功率 8.8%;Opus 4.8 為 68.8%
Anthropic 安全報告中 Sonnet 5 的安全指標
Anthropic 的安全報告指出,Claude Sonnet 5 相較 Sonnet 4.6,幻覺(hallucination)與諂媚傾向(sycophancy)更低,拒絕惡意請求的能力更強,且此版本已預設啟用網路安全防護機制。報告同時指出,Sonnet 5 在不當行為發生率上仍高於 Opus 4.8,也高於嚴格限制版的 Claude Mythos Preview。
常見問題
Claude Sonnet 5 何時設為 Free 與 Pro 用戶的預設模型?
Anthropic 於 2026 年 7 月 1 日正式發布 Claude Sonnet 5 的同日,將其設為 Free 與 Pro 用戶的預設模型。
Anthropic 公布的跑分是否有第三方驗證?
Anthropic 公布的所有 Claude Sonnet 5 跑分均為官方自評數據。Anthropic 未提供第三方獨立驗證報告,亦未說明預計提交第三方驗證的時間表。
新版 tokenizer 對 API 用戶帳單有何影響?
Anthropic 說明相同輸入在新 tokenizer 下產生的 token 數量為前代的 1.0 至 1.35 倍,官方聲稱定價已調整為「大致成本中性」。Anthropic 建議高流量用戶自行執行基準測試,以評估實際帳單影響,並未保證所有場景下帳單不會上升。