DeepSeek 以 98% 低於 OpenAI 的 GPT-5.5 Pro 成本發布 V4-Pro 與 V4-Flash 模型

Gate News 消息,4 月 25 日——DeepSeek 於 4 月 24 日發布 V4-Pro 與 V4-Flash 的預覽版本;兩者皆為開放權重模型,擁有一百萬 token 的上下文視窗。V4-Pro 具備 1.6 兆的總參數,但在每次推論時僅啟用 490 億參數,並採用 Mixture-of-Experts 架構。V4-Flash 具備 2,840 億的總參數,其中啟用 130 億。

定價顯著低於競品:V4-Pro 的每百萬輸入 token 成本為 $1.74,每百萬輸出 token 成本為 $3.48——約比 OpenAI 的 GPT-5.5 Pro 低 98% ($30 input,$180 output);且其成本約為 Claude Opus 4.7 的 五十分之一。V4-Flash 的價格為每百萬 token 輸入 $0.14、輸出 $0.28。兩款模型均以 MIT 授權開源,且可在本地免費運行。

DeepSeek 透過兩種新的注意力機制實現效率提升:Compressed Sparse Attention 與 Heavily Compressed Attention,將計算成本降低至 V4-Pro 前代機型的 27% (V3.2),以及將 V4-Flash 降至 10%。該公司在部分 V4 訓練中使用了華為 Ascend 晶片,繞過了美國對先進 Nvidia 處理器的出口限制。DeepSeek 表示,待 2026 年下半年新增 950 個新超節點啟動後,定價還將進一步下調。

在效能基準測試中,V4-Pro-Max 在 Codeforces 競賽程式設計 (3,206 分排名第一,位於人類參賽者中的約第 23 名),並在 Apex Shortlist 數學題上取得 90.2% 的分數,而 Claude Opus 4.6 為 85.9%。然而,它在多任務基準上表現落後:MMLU-Pro (87.5% 對比 Gemini-3.1-Pro 的 91.0%),以及 Humanity’s Last Exam (37.7% 對比 44.4%)。在長上下文任務上,V4-Pro 領先開源模型,但在 MRCR 檢索測試中落後於 Claude Opus 4.6。

V4-Pro 引入“interleaved thinking(交錯式思考)”,使代理工作流程能在多次工具呼叫之間保留推理上下文,而無需在步驟之間刷新。兩款模型均支援與 Claude Code 與 OpenCode 的編碼整合。根據 DeepSeek 對 85 位開發者進行的調查,52% 的受訪者表示 V4-Pro 已可作為其預設的程式代理,另有 39% 傾向採用。舊版 deepseek-chat 與 deepseek-reasoner 端點將於 2026 年 7 月 24 日退役。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Anthropic 推 Claude Dreams:Agent 在工作之間自整理記憶、消除重複與矛盾

Anthropic 在 Code with Claude 大會公布 Dreams,讓 Claude Managed Agents 在多場會話間自動整理記憶、消除重複與矛盾、更新陳舊條目,輸出可審核的整理後記憶庫;輸入上限為 100 個 session 與 4,096 字元,非同步執行,數分鐘至數十分鐘完成,支援串流觀察。研究預覽需申請,暫只支援 claude-opus-4-7 與 claude-sonnet-4-6,正式上市未定。

鏈新聞abmedia22分鐘前

Anthropic 接 SpaceX 算力:拿下 Colossus 1 整座 22 萬 GPU、Claude 解除限額

Anthropic 宣布與 SpaceX 就 Colossus 1 資料中心達成算力合作,將動用逾22萬顆 Nvidia GPU、300MW以上容量,預計一個月內全部部署供 Anthropic 使用,提升 Claude、Code 的運算與體驗。同步放寬 Pro/Max/Team/Enterprise 的每5小時用量上限、取消尖峰限額,並提高 Opus API 速率;亞洲歐洲基礎設施同步擴張,未來另有「軌道 AI 計算」等意向,尚未成約。

鏈新聞abmedia33分鐘前

Coinbase 工程師:AI 代理可能會顛覆網路廣告模式

Coinbase 工程師 Erik Reppel 表示,人工智慧代理(AI agents)可能從根本上削弱仰賴網路廣告的商業模式。根據 Reppel 的說法,網路經濟高度仰賴由人類使用者產生的廣告收入,但 AI 代理會繞過這套系統

Crypto Frontier1小時前

Anthropic 在與 SpaceX 合作取得 300MW 產能後,將 Claude Code 的速率限制加倍

根據 Odaily,Anthropic 已與 SpaceX 簽署協議,以存取 Colossus 1 資料中心的全部運算能力,確保在一個月內獲得超過 300 百萬瓦的新產能,以及超過 220,000 台 NVIDIA GPU。自即日起,Claude Code 的 Pro 五小時速率限制,

GateNews1小時前

OpenAI 公布 MRC 超級電腦網路協議!攜手輝達、AMD、微軟打造 Stargate 基礎設施

OpenAI 公布 AI 超級電腦網路協議 MRC,與 AMD、Microsoft、NVIDIA 等合作並開源於 OCP。MRC 將資料分拆同時走多條路徑、在微秒級避障、降低壅塞,維持 GPU 同步,解決大型訓練叢集的傳輸瓶頸。Stargate 德州 Abilene 等基地已部署 800Gb/s 介面並投入實際訓練。

鏈新聞abmedia1小時前

AI 招募平台 Ethos 完成 2275 萬美元 A 輪融資,於 5 月 6 日由 a16z 領投

根據 BlockBeats,總部位於倫敦的 AI 招聘平台 Ethos 於 5 月 6 日完成 2,275 萬美元 A 輪融資,由 Andreessen Horowitz(a16z)領投,General Catalyst 參投。該平台使用 AI 進行面試並分析

GateNews2小時前
留言
0/400
暫無留言