OpenAI 與 Broadcom 發表 Jalapeño,首款專為 LLM 推論設計的自訂 AI 晶片

OpenAI 和 Broadcom 今日共同發表 Jalapeño,這是 OpenAI 首款專為大型語言模型推理設計的智慧處理器。該晶片由 Broadcom 總裁暨執行長 Hock Tan 及總裁 Charlie Kawwas 交付給 OpenAI 執行長 Sam Altman 與總裁 Greg Brockman。這款加速器是雙方共同打造、涵蓋多世代運算平台的首款 AI 晶片,目標是讓先進 AI 更快、更可靠且更容易取得。OpenAI 基於對 LLM 基礎原理的理解從零開始設計晶片,Broadcom 與 Celestica 則協助將其工業化,涵蓋晶片實現、電路板與機櫃系統整合、高效能網路以及可規模化生產系統。

OpenAI 與 Broadcom 將 Jalapeño 晶片交付公司高層

這款晶片的交付標誌著 OpenAI 建構模型與產品全端堆疊策略的重要一步。Jalapeño 由 OpenAI、Broadcom 與 Celestica 三方合作開發,各家貢獻其專業領域技術。

OpenAI 根據其模型、核心(kernel)、服務系統及產品需求的藍圖設計晶片架構。Broadcom 提供晶片實現與網路技術(包括 Tomahawk 晶片),協助將平台推向大規模生產。Celestica 則提供電路板、機櫃系統整合及可規模化生產系統的專業知識。

Jalapeño 架構針對 LLM 推理工作負載最佳化

Jalapeño 設計上具有靈活性,可適用於所有 LLM,且基於 OpenAI 對當前及未來業界 AI 模型推理需求的深入洞察。工程樣品已在實驗室中以量產目標頻率與功耗執行 ML 工作負載,包括 GPT-5.3-Codex-Spark。

早期測試顯示,Jalapeño 的每瓦效能將顯著優於當前最佳技術。該架構減少資料搬移,並平衡運算、記憶體與網路資源,使實際利用率更接近理論峰值效能。詳細技術報告將於未來數月內公布。

「Jalapeño 是從頭開始為 LLM 推理設計的,利用了我們與 OpenAI 研究人員密切合作的深入洞察,」OpenAI 硬體計畫負責人 Richard Ho 表示。「我們圍繞著對前沿 AI 模型最重要的核心(kernel)、記憶體搬移、網路與服務模式來最佳化架構。根據早期測試,Jalapeño 將能高效執行我們最重要的負載,接近硬體的理論極限。」

這款晶片是專為現代 LLM 推理設計的空白設計,而非改編自早期 AI 工作負載的通用加速器。其設計靈感來自 OpenAI 每天在 ChatGPT、Codex、API 及未來代理型產品中運作的系統。目標是結合當前領先 AI 加速器的強大效能與吞吐量,以及更接近最快專用推理系統的低延遲。

九個月開發時程完成,採用 AI 輔助設計

Jalapeño 從初始設計到製造定案(tape-out)僅耗時九個月即共同開發完成。各公司認為這代表高效能先進半導體領域有史以來最快的 ASIC 開發週期。

加速的時程反映了 OpenAI 工程團隊的深度軟硬體共同開發、Broadcom 的晶片實現專業知識,以及使用 OpenAI 模型加速部分設計與最佳化流程。提供給使用者使用的相同模型,正協助改善未來模型運行的基礎設施。

與 Broadcom 及 Celestica 規劃多世代運算平台

Jalapeño 是多世代運算平台的第一步,該平台結合 OpenAI 設計的加速器、Broadcom 的晶片實現、網路與連接技術,以及 Celestica 的電路板、機櫃與系統專業知識。

「世界正走向以運算驅動的經濟,」OpenAI 總裁暨共同創辦人 Greg Brockman 表示。「Jalapeño 是我們長期全端基礎設施策略的一部分,目的是讓運算更加普及,從而讓 AI 變得更快、更可靠、更實惠,造福個人與企業,並可用於解決更多重要問題。透過自行設計更多堆疊層,我們可以更有效率地提供更多智慧,並持續推動先進 AI 走向更廣泛的普及。」

預計 2026 年底前部署

這款多世代運算平台預計在 2026 年底前進行初始部署,並在未來數年持續擴展。OpenAI 營運涵蓋全端,包括晶片架構、核心(kernel)、記憶體系統、網路、排程、部署系統與產品體驗,每一層都圍繞著讓其模型更快、更可靠、更實惠的使用者目標進行最佳化。

常見問題

什麼是 Jalapeño?何時發表的?

Jalapeño 是 OpenAI 首款智慧處理器,一款專為大型語言模型推理設計的 AI 加速器。OpenAI 與 Broadcom 於今日共同發表該晶片。

開發 Jalapeño 耗時多久?

Jalapeño 從初始設計到製造定案(tape-out)共耗時九個月共同開發完成。各公司認為這代表高效能先進半導體領域有史以來最快的 ASIC 開發週期。

Jalapeño 何時部署?

搭載 Jalapeño 的多世代運算平台預計在 2026 年底前進行初始部署,並規劃在未來數年持續擴展。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆