輝達於 Computex 發表 Nemotron 3 Ultra,並在情報排行榜中追趕中國的 Kimi K2.6

Nvidia 於 6 月 1 日在台北 Computex 發表 Nemotron 3 Ultra,這是一款 550 億參數的開放權重(open-weight)AI 模型,代表該公司迄今規模最大的開放式 AI 發布。執行長 Jensen Huang 在主題演講中宣布該模型,並將其定位為情報基準(intelligence benchmarks)中排名最高的美國開放權重模型。此發布加劇了開放權重 AI 領域的競爭;儘管 Nvidia 擁有速度優勢,中國模型包含 Moonshot AI 的 Kimi K2.6 目前仍領先全球情報排行榜。

Nemotron 3 Ultra 在 Intelligence Index 基準中得分 48

與 Nvidia 進行預發布評估合作的 Artificial Analysis,將 Nemotron 3 Ultra 於其 Intelligence Index 評為 48。這項綜合基準整合 10 項評估,涵蓋推理、程式碼、一般知識與代理(agentic)表現。該分數使 Nemotron 3 Ultra 成為頂尖的美國開放權重模型,超越 Google 的 Gemma 4 31B(39)、Nvidia 自家的 Nemotron 3 Super(36)以及 OpenAI 的 gpt-oss-120b(33)。

該模型採用混合專家(mixture-of-experts)架構,總參數為 550 億,但在任一時刻僅啟用 55 億。此設計在降低營運成本的同時,仍能在複雜推理任務上維持表現。

預發布端點達到每秒 300+ tokens

根據 Artificial Analysis 的測試,Nemotron 3 Ultra 在預發布的 DeepInfra 端點上,輸出速度超過每秒 300 個輸出 tokens。同一情報等級的中國模型(DeepSeek V4 Pro 與 Kimi K2.6)目前透過其商用 API 運作速度為每秒 50–100 tokens。Nvidia 宣稱,該模型比可比的開放權重替代方案快 5 倍,且成本降低 30%。

該架構結合 Mamba-2 層、標準 Transformer 注意力(attention),以及混合專家路由(mixture-of-experts routing)。模型支援 100 萬 tokens 的上下文窗口,並加入多 token 預測(MTP),可同時生成多個未來 tokens,而非依序逐個生成。

Kimi K2.6 以 54 的情報分數領先開放權重排名

Moonshot AI 的 Kimi K2.6 在開放權重模型中以 54 的 Intelligence Index 分數取得第一名,較 Nemotron 3 Ultra 高出 6 分。Kimi K2.6 於 4 月釋出,位居所有 AI 模型全球第 4 名,落後 Anthropic、Google 與 OpenAI 的自家旗艦(proprietary flagships)3 分;而這三者並列 57。

3 月的報告指出,截至 2025 年底,中國開源模型在全球開放模型使用量的占比,已從 2024 年底約 1.2% 提升至約 30%。

Nemotron 系列自 2023 年起涵蓋三種模型規模

Nvidia 於 2023 年 11 月釋出第一款冠名 Nemotron 的模型,並在 2025 年 12 月公布第三代。該系列包含三種規模:Nano 用於輕量任務,Super 用於中階企業應用,Ultra 用於複雜推理工作負載。這三款模型皆共享混合架構,結合 Mamba-2 層、Transformer 注意力,以及混合專家路由。

Nemotron 3 Super 於 3 月發布,參數規模為 1200 億,Intelligence Index 得分為 36。Nemotron 3 Ultra 的提升 12 分,代表產品線中的重大進展。

Nvidia 投入 $26 Billion 用於開放權重 AI 開發

Nvidia 揭露一項為期五年的計畫,將投入 $26 Billion 於開放權重 AI 開發。該公司於 3 月成立 Nemotron Coalition,這是一個由 8 家 AI 實驗室組成的團隊,包含 Mistral AI 與 Perplexity,將在 DGX Cloud 基礎設施上共同開發開放前沿模型。Nvidia 也宣布正著手開發 Nemotron 4,即該模型家族的下一代。

6 月 4 日透過 Nvidia API 與雲端供應商出貨

Nemotron 3 Ultra 將於 6 月 4 日出貨。該模型的權重公開,且訓練配方(training recipes)也將釋出。使用者可透過 Nvidia 的 API 或雲端供應商存取該模型,無需額外的資料中心硬體。

FAQ

Nvidia 的 Nemotron 3 Ultra 在 6 月 1 日的情報分數是多少? Nemotron 3 Ultra 在 Artificial Analysis Intelligence Index 得分 48,使其成為排名最高的美國開放權重模型。該基準整合 10 項評估,涵蓋推理、程式碼、一般知識與代理(agentic)表現。

Nemotron 3 Ultra 的速度與中國模型相比如何? Nemotron 3 Ultra 在預發布的 DeepInfra 端點上輸出速度超過每秒 300 個 tokens,而中國模型 DeepSeek V4 Pro 與 Kimi K2.6 則透過其商用 API 運作於每秒 50–100 tokens。

Nvidia 的 Nemotron 3 Ultra 何時可用? Nemotron 3 Ultra 將於 6 月 4 日出貨。使用者可透過 Nvidia 的 API 或雲端供應商存取該模型;模型權重與訓練配方將公開釋出。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆