AI 浪潮推动記憶體需求与价格水漲船高,然而外界仍擔憂 HBM 是否会重蹈「週期性」覆徹,像过去的 DRAM 一樣,在需求高峰后迅速反转?半導體架構分析人士 fin 对此指出,HBM 的需求逻辑,已与傳统記憶體产业規律脫鉤,正透过 token 重新定价。
(記憶體漲勢趨緩?机構評估 Q2 漲幅縮窄至 30%,下半年进一步降溫)
CPU 时代的記憶體:可有可无的附屬品
fin 指出,在 CPU 主導运算的年代,DDR 記憶體的角色始終只是輔助角色。CPU 工程師发展出一整套掩蓋記憶體延遲的架構技巧,包括超純量设计、多層快取、暫存器重新命名等,让處理器得以在不倚賴高速記憶體的條件下維持高效能:
工业界的经验法則是,即便 DDR 频寬直接翻倍,CPU 整體效能的提升也往往不超过两成。
这樣的架構直接塑造了过去數十年 DRAM 产业的成长節奏。DDR3 到 DDR5,歷时整整十五年;过去十年间,一般 PC 的 DDR 容量从 7 至 8 GB 增长至约 23 GB,十年僅成长三倍。DRAM 廠商的主要獲利来源为容量大小,频寬升級不过是拉高單位售价的手段。
在 CPU 时代,記憶體就是晶片产业裡边际效用最低的一環,週期性起伏是常態、也是宿命。
AI 推理时代来臨,从根本改寫記憶體价值標準
然而,当运算主角切換至 AI 推理引擎,衡量標準也随之更迭,晶片廠商比的是每秒能執行多少次浮点运算;如今,AI 时代的核心 KPI 只有一个:每單位成本与每單位功耗,能夠产生多少个 Token。
輝达執行长黄仁勳所提出的「AI 工廠」概念,精確描述了这套新逻辑:AI 工廠存在的意義,就是以最低成本生产最多 Token,同时把 Token 的输出速度推向極限。優化目標由單一維度向外擴展,需同时最大化 Token 的總吞吐量,也追求每个请求的 Token 输出速度。
这个 KPI 的改變,則成了 HBM 命运翻转的起点。
Token 吞吐量公式,揭开 HBM 需求的第一性原理
fin 將 AI 推理的 Token 吞吐量,拆解为两个參數的乘積:「同时處理的请求批次數量 × 每个请求的平均 Token 生成速度」追溯这两个參數各自的瓶頸,答案都指向同一个零件。
批次數量的瓶頸,在於 HBM 的儲存容量。每一个推理请求都攜帶著自己的 KV 快取,也就是模型推理过程中儲存中间狀態的机制,而这份快取必須即时存放在 HBM 之中,以便模型每生成一个 Token 时反覆高速读取。批次規模越大,HBM 所需的儲存空间就越大,两者呈線性正比关係。
Token 速度的瓶頸,則在於 HBM 的频寬。模型解碼階段每产生一个 Token,都需要反覆读取龐大的啟动權重与 KV 快取,读取速度直接決定了 Token 的生成效率,而读取速度的上限,就是 HBM 的频寬。
他表示,这个关係可以用机场接駁车做比喻:HBM 容量是接駁车的车廂大小,決定一次能載多少乘客;HBM 频寬是车门的寬度,決定乘客上下车的速度;旅客输送的總吞吐量,則是车廂大小乘以上车速度的積。由此推導出 AI 推理硬體需求的第一原則:
Token 吞吐量 = HBM 容量 × HBM 频寬
若要让每一代 GPU 的 Token 吞吐量維持两倍的世代成长,HBM 容量与 HBM 频寬的乘積就必須每代翻倍。
软體優化解不了題,HBM 需求锁定在指數軌道上
面对这套推論,市场最常见的反駁是:软體優化难道不能降低对 HBM 的依賴?他給出的答案是,软體效率与硬體規格的进步是两个完全獨立的維度,两者並不互相取代。这就像 CPU 软體優化再徹底,仍无法阻止英特爾或 AMD 每一代都必須在標準測試中交出更高的跑分,否則产品就卖不出去。
GPU 的逻辑完全相同:只要全球对 Token 的需求持续擴張,对更高 Token 吞吐量的追求就不会停歇,对 HBM 两方面进步的需求更不会停止。
更关鍵的是,这股壓力並非来自外部景气的拉动,而是供应端的內生需求。只要輝达还要販卖下一代 GPU,就必然要向 SK 海力士、三星、美光施壓,要求每一代 HBM 在容量与频寬上同步躍进,因为 HBM 的天花板,就是 GPU 效能的天花板。
將輝达从 A100 到 Rubin Ultra 各代 GPU 的 Token 吞吐量,与对应的「HBM 容量 × HBM 频寬」數值繪於同一对數座標圖上,两條曲線的吻合程度將令人驚訝。这並非歷史巧合,而是系统最佳化的必然解。
HBM 告別週期宿命,市场定价逻辑仍待重估
綜合上述架構層面的推導,HBM 与傳统 DRAM 的本质差異已然清晰。傳统記憶體是晶片产业的附屬品,需求驅动力薄弱,一旦擴产節奏超越需求復甦,週期性崩价便如期而至。
但 HBM 的需求,已被 AI 推理架構的物理逻辑锁定在指數成长的軌道之上。这与 AI 整體市场的冷熱与總體经濟的景气循環,都不存在直接的因果关係。
当然,真正的问題並不在需求端,而在供应端:SK 海力士、三星与美光这三大玩家,在面对強勁需求时,能否克制过去幾十年间反覆上演的盲目擴产衝动,避免再度埋下供过於求的週期禍根?这个问題的答案將会是本輪記憶體週期,能否长期延续的关鍵變數。
(記憶體股崩跌还能买嗎?三星证券分析師:週期內修正而非景气见顶)
这篇文章 打破週期性迷思!一公式拆解 HBM 需求結構:記憶體为何只会继续上漲? 最早出现於 链新聞 ABMedia。
相关快讯
摩根士丹利分析师预测 iPhone 18 全系列涨价 100 美元,存储器成本飙升成为主因
郭明錤谈台积电 CoWoS 与英特尔 EMIB 差距,称 Google 曾询问跳过联发科自行投片
CryptoQuant:BTC 4 月涨幅由永续合约推动、警告修正风险
台積电 CoWoS 外溢最大受益者?英特爾 EMIB 良率传闻 90%,先进封装或成翻身关键
HBM 后 AI 存储器瓶颈是 HBF?图灵奖得主 David Patterson:推理将重新定义存储架构