輝達於 Computex 發表 Nemotron 3 Ultra，並在情報排行榜中追趕中國的 Kimi K2.6

2026-06-01 22:52:58

Nvidia 於 6 月 1 日在台北 Computex 發表 Nemotron 3 Ultra，這是一款 550 億參數的開放權重（open-weight）AI 模型，代表該公司迄今規模最大的開放式 AI 發布。執行長 Jensen Huang 在主題演講中宣布該模型，並將其定位為情報基準（intelligence benchmarks）中排名最高的美國開放權重模型。此發布加劇了開放權重 AI 領域的競爭；儘管 Nvidia 擁有速度優勢，中國模型包含 Moonshot AI 的 Kimi K2.6 目前仍領先全球情報排行榜。

Nemotron 3 Ultra 在 Intelligence Index 基準中得分 48

與 Nvidia 進行預發布評估合作的 Artificial Analysis，將 Nemotron 3 Ultra 於其 Intelligence Index 評為 48。這項綜合基準整合 10 項評估，涵蓋推理、程式碼、一般知識與代理（agentic）表現。該分數使 Nemotron 3 Ultra 成為頂尖的美國開放權重模型，超越 Google 的 Gemma 4 31B（39）、Nvidia 自家的 Nemotron 3 Super（36）以及 OpenAI 的 gpt-oss-120b（33）。

該模型採用混合專家（mixture-of-experts）架構，總參數為 550 億，但在任一時刻僅啟用 55 億。此設計在降低營運成本的同時，仍能在複雜推理任務上維持表現。

預發布端點達到每秒 300+ tokens

根據 Artificial Analysis 的測試，Nemotron 3 Ultra 在預發布的 DeepInfra 端點上，輸出速度超過每秒 300 個輸出 tokens。同一情報等級的中國模型（DeepSeek V4 Pro 與 Kimi K2.6）目前透過其商用 API 運作速度為每秒 50–100 tokens。Nvidia 宣稱，該模型比可比的開放權重替代方案快 5 倍，且成本降低 30%。

該架構結合 Mamba-2 層、標準 Transformer 注意力（attention），以及混合專家路由（mixture-of-experts routing）。模型支援 100 萬 tokens 的上下文窗口，並加入多 token 預測（MTP），可同時生成多個未來 tokens，而非依序逐個生成。

Kimi K2.6 以 54 的情報分數領先開放權重排名

Moonshot AI 的 Kimi K2.6 在開放權重模型中以 54 的 Intelligence Index 分數取得第一名，較 Nemotron 3 Ultra 高出 6 分。Kimi K2.6 於 4 月釋出，位居所有 AI 模型全球第 4 名，落後 Anthropic、Google 與 OpenAI 的自家旗艦（proprietary flagships）3 分；而這三者並列 57。

3 月的報告指出，截至 2025 年底，中國開源模型在全球開放模型使用量的占比，已從 2024 年底約 1.2% 提升至約 30%。

Nemotron 系列自 2023 年起涵蓋三種模型規模

Nvidia 於 2023 年 11 月釋出第一款冠名 Nemotron 的模型，並在 2025 年 12 月公布第三代。該系列包含三種規模：Nano 用於輕量任務，Super 用於中階企業應用，Ultra 用於複雜推理工作負載。這三款模型皆共享混合架構，結合 Mamba-2 層、Transformer 注意力，以及混合專家路由。

Nemotron 3 Super 於 3 月發布，參數規模為 1200 億，Intelligence Index 得分為 36。Nemotron 3 Ultra 的提升 12 分，代表產品線中的重大進展。

Nvidia 投入 $26 Billion 用於開放權重 AI 開發

Nvidia 揭露一項為期五年的計畫，將投入 $26 Billion 於開放權重 AI 開發。該公司於 3 月成立 Nemotron Coalition，這是一個由 8 家 AI 實驗室組成的團隊，包含 Mistral AI 與 Perplexity，將在 DGX Cloud 基礎設施上共同開發開放前沿模型。Nvidia 也宣布正著手開發 Nemotron 4，即該模型家族的下一代。

6 月 4 日透過 Nvidia API 與雲端供應商出貨

Nemotron 3 Ultra 將於 6 月 4 日出貨。該模型的權重公開，且訓練配方（training recipes）也將釋出。使用者可透過 Nvidia 的 API 或雲端供應商存取該模型，無需額外的資料中心硬體。

FAQ

Nvidia 的 Nemotron 3 Ultra 在 6 月 1 日的情報分數是多少？ Nemotron 3 Ultra 在 Artificial Analysis Intelligence Index 得分 48，使其成為排名最高的美國開放權重模型。該基準整合 10 項評估，涵蓋推理、程式碼、一般知識與代理（agentic）表現。

Nemotron 3 Ultra 的速度與中國模型相比如何？ Nemotron 3 Ultra 在預發布的 DeepInfra 端點上輸出速度超過每秒 300 個 tokens，而中國模型 DeepSeek V4 Pro 與 Kimi K2.6 則透過其商用 API 運作於每秒 50–100 tokens。

Nvidia 的 Nemotron 3 Ultra 何時可用？ Nemotron 3 Ultra 將於 6 月 4 日出貨。使用者可透過 Nvidia 的 API 或雲端供應商存取該模型；模型權重與訓練配方將公開釋出。

View Source

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。