Gate News 消息,4月25日——DeepSeek 于 4月24日发布了 V4-Pro 和 V4-Flash 的预览版本;两者均为开源权重模型,拥有一百万 token 的上下文窗口。V4-Pro 具备 1.6 万亿的总参数,但在每次推理时仅激活 490亿,采用了 Mixture-of-Experts(混合专家)架构。V4-Flash 的总参数为 2840亿,激活参数为 130亿。
定价显著低于竞争对手:V4-Pro 的百万输入 token 成本为 $1.74,百万输出 token 成本为 $3.48——比 OpenAI 的 GPT-5.5 Pro 低约 98% ($30 input,$180 output),同时也大约是 Claude Opus 4.7 成本的 1/20。V4-Flash 的百万 token 输入定价为 $0.14,输出定价为 $0.28。两款模型均在 MIT 许可证下开源,可免费在本地运行。
DeepSeek 通过两种新的注意力机制实现了效率提升:Compressed Sparse Attention(压缩稀疏注意力)和 Heavily Compressed Attention(深度压缩注意力)。这使得计算成本分别降至 V4-Pro 前代版本的 27% (V3.2) 和 V4-Flash 的 10%。该公司部分使用华为 Ascend 芯片训练了 V4,从而规避了美国对先进 Nvidia 处理器的出口限制。DeepSeek 表示,等到 2026 年后续上线 950 个新的超级节点后,定价还将进一步下调。
在性能基准测试中,V4-Pro-Max 在 Codeforces 竞赛编程 (3,206 分排名第一,位于人类参赛者约第 23 名),并在 Apex Shortlist 数学题上取得 90.2% 的成绩,而 Claude Opus 4.6 为 85.9%。不过,它在多任务基准上落后:MMLU-Pro (87.5% 对比 Gemini-3.1-Pro 的 91.0%),以及 Humanity’s Last Exam (37.7% 对比 44.4%)。在长上下文任务上,V4-Pro 在开源模型中领先,但在 MRCR 检索测试中仍落后于 Claude Opus 4.6。
V4-Pro 引入了“交错式思考(interleaved thinking)”,使代理工作流能够在多次工具调用之间保留推理上下文,而无需在步骤之间清空。两款模型都支持与 Claude Code 以及 OpenCode 的编程集成。根据 DeepSeek 对 85 名用户的开发者调查,52% 的受访者表示 V4-Pro 已准备好作为其默认编程代理,另有 39% 倾向于采用。旧版 deepseek-chat 和 deepseek-reasoner 端点将于 2026 年 7月24日下线。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Anthropic 推出 Claude Dreams:Agent 在任务之间自动整理记忆,消除重复与矛盾
Anthropic 在 Code with Claude 大会公布 Dreams,让 Claude Managed Agents 在多场会話间自动整理記憶、消除重複与矛盾、更新陳舊條目,输出可審核的整理后記憶庫;输入上限为 100 个 session 与 4,096 字元,非同步執行,數分鐘至數十分鐘完成,支援串流觀察。研究预覽需申请,暫只支援 claude-opus-4-7 与 claude-sonnet-4-6,正式上市未定。
鏈新聞abmedia18 分钟前
Anthropic 接 SpaceX 算力:拿下 Colossus 1 整座 22 万 GPU、Claude 解除限额
Anthropic 宣布并与 SpaceX 就 Colossus 1 数据中心达成算力合作,将动用逾 22 万颗 Nvidia GPU、300MW 以上容量,预计一个月内全部部署供 Anthropic 使用,提升 Claude、Code 的运算与体验。同步放宽 Pro/Max/Team/Enterprise 的每 5 小时用量上限、取消尖峰限额,并提高 Opus API 速率;亚洲与欧洲基础设施同步扩张,未来另有「轨道 AI 计算」等意向,尚未成约。
鏈新聞abmedia28 分钟前
Coinbase 工程师:AI 代理可能会颠覆网络广告模式
Coinbase 工程师 Erik Reppel 表示,人工智能代理可能从根本上动摇依赖互联网广告的商业模式。根据 Reppel 的说法,网络经济在很大程度上依赖于来自人类用户的广告收入,但 AI 代理会绕过该系统。
Crypto Frontier1小时前
Anthropic 在与 SpaceX 达成协议并获得 300MW 产能后,将 Claude 代码速率限制翻倍
据 Odaily 报道,Anthropic 已与 SpaceX 签署协议,以访问 Colossus 1 数据中心的全部计算能力,确保在本月内新增超过 300 兆瓦的产能以及超过 220,000 台 NVIDIA GPU。自即日起,Claude Code 针对 Pro 的五小时限流,
GateNews1小时前
OpenAI 发布 MRC 超级计算机网络协议!携手 NVIDIA、AMD、微软打造 Stargate 基础设施
OpenAI 公布 AI 超级计算机网络协议 MRC,与 AMD、Microsoft、NVIDIA 等合作并在 OCP 开源。MRC 将数据分拆同时走多条路径,在微秒级避障、降低拥塞,维持 GPU 同步,解决大型训练集群的传输瓶颈。Stargate 德州 Abilene 等基地已部署 800Gb/s 接口并投入实际训练。
鏈新聞abmedia1小时前
AI 招聘平台 Ethos 完成 2200 万美元 A 轮融资,由 a16z 于 5 月 6 日领投
据 BlockBeats 称,总部位于伦敦的 AI 招聘平台 Ethos 于 5 月 6 日完成了 2275 万美元的 A 轮融资,Andreessen Horowitz(a16z)领投,General Catalyst 参与。该平台使用 AI 面试候选人并分析
GateNews2小时前