騰訊開源 Hy3 預覽版,程式碼基準測試較前代提升 40%

Market Whisper

騰訊開源Hy3預覽版

騰訊於 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式開源 Hy3 預覽版大型語言模型,並同步於騰訊雲端(Tencent Cloud)提供付費 API 服務。據 Decrypt 於 4 月 24 日報導,Hy3 預覽版自 1 月下旬啟動訓練,至發布日歷時不足三個月。

Hy3 模型架構與開發背景

根據騰訊官方公告,Hy3 預覽版為混合專家架構,將各查詢路由至指定專家子網路子集處理,而非同步啟用全部參數,以降低計算需求。

前一代旗艦模型 Hy2 的參數量逾 4,000 億。騰訊官方聲明指出,2,950 億為推理效益最佳化後的設定,超出此規模後增加參數的邊際效益不再合算。

根據 Decrypt 報導,Hy3 的訓練工作由騰訊首席人工智慧科學家姚順宇(Yao Shunyu)主導,其於 2026 年 2 月完成預訓練與強化學習堆疊的基礎設施重建後,Hy3 訓練正式展開。

關鍵基準測試數據

根據騰訊官方公告所披露的基準測試結果:

SWE-bench Verified(GitHub 真實程式碼錯誤修復):Hy3 預覽版 74.4%,Hy2 為 53.0%;同期 GLM-5 為 77.8%,Kimi-K2.5 為 76.8%,Claude Opus 4.6 為 80.8%

Terminal-Bench 2.0(命令列自主任務執行):Hy3 預覽版 54.4%,Hy2 為 23.2%

BrowseComp(複雜網路搜尋任務):Hy3 預覽版 67.1%,Hy2 為 28.7%

WideSearch:Hy3 預覽版 70.2%,高於 GLM-5 及 Kimi-K2.5,低於 Claude Opus 4.6 的 77.2%

清華大學數學博士資格考試(2026 年春季):三次運行平均分(avg@3)88.4,為中國模型最高分

2025 年中國高中生物奧林匹克競賽(CHSBO 2025):87.8 分,為同類中國模型最高分

部署平台與 API 定價

根據騰訊官方公告,Hy3 預覽版已部署於以下平台:元寶(Yuanbao)、QQ、騰訊文件(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。

騰訊雲端 API 定價為每百萬輸入標記 0.18 美元、每百萬輸出標記 0.59 美元;個人標記計劃月費起價約 4.10 美元。騰訊公告亦顯示,Hy3 在 CodeBuddy 與 WorkBuddy 上的首標記延遲較前代降低 54%,端對端生成時間縮短 47%,並成功完成 495 步驟的代理工作流程。

常見問題

騰訊 Hy3 預覽版何時發布,可在哪些平台取得?

根據騰訊官方公告及 Decrypt 2026 年 4 月 24 日報導,Hy3 預覽版於 2026 年 4 月 23 日(週四)在 GitHub、Hugging Face 及 ModelScope 開源,騰訊雲端同步提供付費 API 服務。

Hy3 預覽版與前代模型 Hy2 相比,主要基準測試差異為何?

根據騰訊官方公告,SWE-bench Verified 評分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。

Hy3 預覽版的 API 定價為何?

根據騰訊雲端官方定價,Hy3 預覽版 API 起價為每百萬輸入標記 0.18 美元,每百萬輸出標記 0.59 美元;個人標記計劃月費起價約 4.10 美元。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

2026 SusHi Tech Tokyo 揭幕、台灣館率 27 家新創深耕台日合作

國發會領軍27家新創參展SusHi Tech Tokyo 2026,打造台灣館為最大國家展,展現AI與永續科技實力,並以Startup Island TAIWAN品牌推動亞洲新創策略聯盟。展期間簽署日方備忘錄深化供應鏈合作;另舉辦Asia MirAI Day,促成亞太新創網路。預計吸引逾6萬參與、700家新創,並上萬場商務洽談。

鏈新聞abmedia30分鐘前

OpenAI 未達成成長目標;科技股下挫

在傳出 OpenAI 未達其自身的成長與銷售目標的報導後,六檔主要科技股急挫。此舉顯示交易者正在重新評估該公司為龐大的運算基礎設施承諾提供資金的能力。週二的下跌影響到 Coreweave (CRWV)、SoftBank Group (9984.T)、

Crypto Frontier1小時前

美國科技股拋售因 OpenAI 擔憂而升溫,亞洲市場預計開局平淡

Gate News 消息,4 月 28 日——在美國市場因科技股主導的拋售而承壓之後,亞洲股市料將審慎開盤。該輪拋售源於相關報導:OpenAI 未能達到其在新增用戶獲取與銷售方面的自定目標。消息發布後,標普 500 指數(S&P 500)自創紀錄水準下滑,引發外界對於龐大的 AI 基礎設施支出是否能帶來足夠回報的疑慮。

GateNews2小時前

Anthropic估值觸及 $1 兆美元,在二級市場超越OpenAI

Gate News 消息,4月28日——Anthropic在私人市場估值上已超越OpenAI,其在近期二級交易中推算價值已突破 $1 兆美元。OpenAI在類似市場中的估值已徘徊在約 -9223372036854775808億美元。這項變化標誌著AI產業的動能出現了劇烈的轉折,

GateNews4小時前

NVIDIA 發表 Nemotron 3 Nano Omni 開源多模態

NVIDIA 公布 Nemotron 3 Nano Omni 開源多模態模型,將視覺、語音與語言整合於單一模型,作為 AI 代理的感知層。核心為 30B-A3B MoE、256K context、9x 吞吐,支援文字、影像、音訊、影片等輸入,輸出為文字。與 Nemotron 3 Super/Ultra 協同,適用電腦操作、文件智慧與音畫理解等場景,並公開權重與訓練資料,部署覆蓋本地、NIM 與第三方平台。

鏈新聞abmedia4小時前

Claude Code 加入手機推播:長任務完成或需審核時自動提醒

Claude Code 現可透過手機推播通知,於長任務完成或需要用戶介入時提醒。啟用條件為 Remote Control 啟動與 config 內的「Push when Claude decides」。底層推送工具自 4 月 15 日 v2.1.110 加入,此公告屬對外行銷層級。

鏈新聞abmedia5小時前
留言
0/400
暫無留言