根據 Jefferies 於 6 月 22 日發布的 AI 報告,截至 6 月 22 日止的一週中,中國 AI 模型共消耗 18.8 萬億個 tokens,超越美國模型的 5.8 萬億個 tokens。DeepSeek V4 Flash 以 4.94 萬億個 tokens 排名第一,其後依序為小米的 MiMo-V2.5、MiniMax M3,以及騰訊的 Qwen。OpenRouter 的數據顯示,平台層級的 token 消耗量較前一週成長 4.7%,至 46.7 萬億。
這種轉變反映了中國模型在效能與成本之間的競爭平衡。Jefferies 指出,中國模型目前已縮小與美國同類的智慧差距,同時提供的 API 成本僅為美國替代方案的一小部分;這歸因於 MoE 架構與優化的注意力機制。企業支出仍偏低迷,Jefferies 的 LLM Token Expenditure Index 在 6 月 14–19 日為 1.64–1.68,低於 5 月 31 日的 2.04,顯示開發者轉向更便宜、效率更高的模型。