分析師 Zeitgeist 表示,應用於人工智慧的記憶體晶片需求,已遠超出目前全球產能,差距達數個數量級;這意味著,若以真實運算需求來估值而非依據歷史高點,記憶體製造商的庫存價值可能會上漲十倍。Zeitgeist 提供了一個投資例子:去年 9 月投入 50,000 美元買入 Micron 股票,至今約值 489,000 美元。該分析師將供需失衡歸因於 AI 加速器中固定的高頻寬記憶體(HBM)限制,以及 AI 代理的快速普及;相較於傳統聊天機器人,AI 代理每次會話所消耗的記憶體要多得多——而這種轉變發生在記憶體產量成長速度比使用量增長更慢的情況下。
AI 加速器面臨固定記憶體上限
每台 AI 加速器出廠時都配有固定數量的高速記憶體,部署後無法擴充。根據 Zeitgeist 的說法,一顆標準 H100 晶片配備 80 GB 的 HBM;更新世代最高可達 192 GB,而未來的 B300 將會有 288 GB。這個上限決定了單一加速器能同時處理多少請求。
該分析師解釋,主要的記憶體負載並非來自模型權重,而是來自 KV 快取——會話記憶,會隨著每個生成的 token 而成長。Zeitgeist 計算,一個擁有 128,000-token 上下文的單次會話,需要約 20 GB 的記憶體;因此,僅有四個這樣的會話就會把單顆 H100 的資源完全耗盡。分析師表示,像 Claude Opus 4.8 或 GPT-5.5 這類先進模型,對於單次長請求可能需要 40 GB 到 100 GB。
分析師從代理採用計算出 60 倍記憶體缺口
Zeitgeist 指出,從單純聊天機器人轉向 AI 代理,是記憶體需求的關鍵推動力。一般問題所造成的記憶體負擔很低,但一個能自行呼叫工具並累積上下文的代理,很容易達到 100,000 tokens 甚至更多。分析師計算,一名單獨知識工作者若同時運行十個這樣的代理,就需要約 152 GB 的記憶體。
Zeitgeist 亦指出,全球大約有 2.5 億名知識工作者。分析師估計,若每人每天進行 100 次代理式會話,全球所需的記憶體將比 2026 年預計產出的總量多約 60 倍。Zeitgeist 承認新的注意力(attention)方法可以使記憶體使用量降低 4 到 8 倍,但他表示由於代理取代了簡單聊天、上下文視窗從 128,000 擴展到 10,000,000 tokens、以及每位工作者的 AI 使用量從零走向數百次會話,因而需求成長速度更快。
SK Hynix 以 AI 記憶體需求暴增之勢超越三星
南韓記憶體製造商 SK Hynix 超越三星,成為該國最有價值的上市公司,這由於其在用於人工智慧工作負載的高頻寬記憶體晶片領域的地位。Zeitgeist 表示,這種轉變支持了一項論點:記憶體生產商正成為 AI 基礎建設競賽的主要受益者;隨著 HBM 需求的成長速度快於供應,能夠生產先進記憶體晶片的公司,營收與估值有望大幅上升。
FAQ
Zeitgeist 分析師對記憶體晶片股票估值說了什麼?
Zeitgeist 表示,若以實際運算需求來估值而非依據歷史高點,記憶體製造商的股票可能從目前水準上漲十倍;他指出,由於 AI 記憶體需求遠超全球產能,差距達數個數量級。
依 Zeitgeist 來看,AI 代理的單次會話需要多少記憶體?
Zeitgeist 計算,一個具有 128,000-token 上下文的單次會話需要約 20 GB 的記憶體;而像 Claude Opus 4.8 或 GPT-5.5 這類先進模型,對單次長請求則需要 40 GB 到 100 GB。分析師估計,一名知識工作者若同時運行十個平行的代理式會話,將需要約 152 GB 的記憶體。