騰訊開源 Hy3 預覽版,程式碼基準測試較前代提升 40%

Market Whisper

騰訊開源Hy3預覽版

騰訊於 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式開源 Hy3 預覽版大型語言模型,並同步於騰訊雲端(Tencent Cloud)提供付費 API 服務。據 Decrypt 於 4 月 24 日報導,Hy3 預覽版自 1 月下旬啟動訓練,至發布日歷時不足三個月。

Hy3 模型架構與開發背景

根據騰訊官方公告,Hy3 預覽版為混合專家架構,將各查詢路由至指定專家子網路子集處理,而非同步啟用全部參數,以降低計算需求。

前一代旗艦模型 Hy2 的參數量逾 4,000 億。騰訊官方聲明指出,2,950 億為推理效益最佳化後的設定,超出此規模後增加參數的邊際效益不再合算。

根據 Decrypt 報導,Hy3 的訓練工作由騰訊首席人工智慧科學家姚順宇(Yao Shunyu)主導,其於 2026 年 2 月完成預訓練與強化學習堆疊的基礎設施重建後,Hy3 訓練正式展開。

關鍵基準測試數據

根據騰訊官方公告所披露的基準測試結果:

SWE-bench Verified(GitHub 真實程式碼錯誤修復):Hy3 預覽版 74.4%,Hy2 為 53.0%;同期 GLM-5 為 77.8%,Kimi-K2.5 為 76.8%,Claude Opus 4.6 為 80.8%

Terminal-Bench 2.0(命令列自主任務執行):Hy3 預覽版 54.4%,Hy2 為 23.2%

BrowseComp(複雜網路搜尋任務):Hy3 預覽版 67.1%,Hy2 為 28.7%

WideSearch:Hy3 預覽版 70.2%,高於 GLM-5 及 Kimi-K2.5,低於 Claude Opus 4.6 的 77.2%

清華大學數學博士資格考試(2026 年春季):三次運行平均分(avg@3)88.4,為中國模型最高分

2025 年中國高中生物奧林匹克競賽(CHSBO 2025):87.8 分,為同類中國模型最高分

部署平台與 API 定價

根據騰訊官方公告,Hy3 預覽版已部署於以下平台:元寶(Yuanbao)、QQ、騰訊文件(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。

騰訊雲端 API 定價為每百萬輸入標記 0.18 美元、每百萬輸出標記 0.59 美元;個人標記計劃月費起價約 4.10 美元。騰訊公告亦顯示,Hy3 在 CodeBuddy 與 WorkBuddy 上的首標記延遲較前代降低 54%,端對端生成時間縮短 47%,並成功完成 495 步驟的代理工作流程。

常見問題

騰訊 Hy3 預覽版何時發布,可在哪些平台取得?

根據騰訊官方公告及 Decrypt 2026 年 4 月 24 日報導,Hy3 預覽版於 2026 年 4 月 23 日(週四)在 GitHub、Hugging Face 及 ModelScope 開源,騰訊雲端同步提供付費 API 服務。

Hy3 預覽版與前代模型 Hy2 相比,主要基準測試差異為何?

根據騰訊官方公告,SWE-bench Verified 評分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。

Hy3 預覽版的 API 定價為何?

根據騰訊雲端官方定價,Hy3 預覽版 API 起價為每百萬輸入標記 0.18 美元,每百萬輸出標記 0.59 美元;個人標記計劃月費起價約 4.10 美元。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

AI 金融平台 Rogo 在不到 3 個月內完成 B 輪融資,由 Kleiner Perkins 領投

根據 Beating 的說法,為高頻金融情境而設計的 AI 平台 Rogo 於 2026 年 4 月完成了一輪 $160 百萬美元的 B 輪融資,由 Kleiner Perkins 領投,並有 Sequoia、Thrive Capital、Khosla Ventures 以及 J.P. Morgan 參與。本輪融資在該公司於 1 月下旬完成 百萬美元的 C 輪融資後不到三個月,使總融資額超過 百萬美元。 Rogo 同步推出 Felix,這是一個面向金融專業人士的 AI 代理平台。該平台使投資銀行家與分析師能夠將金融建模、報表分析與簡報製作等多步任務委派給 Felix,從而騰出時間投入高槓桿的客戶工作。目前,該平台已被超過 35,000 名專業人士使用,覆蓋超過 250 家頂級投資銀行、資產管理公司以及私募股權公司。

GateNews1小時前

China Blocks Meta-Backed Manus AI Acquisition on April 29, Citing Tech and Data Security Concerns

According to PANews, on April 29, China's National Development and Reform Commission investment security review office banned a foreign acquisition of the Manus project and required the transaction be terminated. Manus, billed as the world's first general artificial intelligence agent, had

GateNews1小時前

阿里雲將 DeepSeek-V4-Pro 隱式快取定價調降至 4 月 29 日起每 100 萬個 tokens 1 元

根據阿里雲的說明,其百炼平台將把 DeepSeek-V4-Pro 模型的隱式快取 (Implicit Cache) 的定價降低至自 2026 年 4 月 29 日 23:59:59(北京時間)起,每 100 萬個 tokens 收費 1 元。僅當請求命中快取時才適用隱式快取;快取中的輸入 tokens 將按快取的 cached_token 費率計費,而未命中快取的輸入 tokens 則按標準 input_token 費率收費。此調整僅影響隱式快取的定價;基礎模型推論費率維持不變。

GateNews2小時前

AI 平台 Certifyde 以 $2M 種子輪融資邀請 Ripple 執行長 Brad Garlinghouse 入局

根據 ChainCatcher 報道,AI 應用平台 Certifyde 宣布完成一輪 $2 百萬美元種子輪融資。投資方包括 K5 Global、Flamingo Capital,以及天使投資人,例如 Ripple 執行長 Brad Garlinghouse、Honey 聯合創始人 George Ruan,以及 Nutra 聯合創始人 Roland Peralta。

GateNews4小時前

DeepSeek 於測試版中推出影像辨識功能

根據 PANews,DeepSeek 於今天 (April 29) 推出了其影像辨識功能,目前處於測試版。網頁版與行動應用程式的使用者都有可能被選中參與測試版推送。

GateNews5小時前

Anthropic 為 Claude 推出 8 個創意工具連接器,包含 Blender、Adobe、Autodesk

Anthropic 已宣布一系列創意工具連接器,讓 Claude 能夠直接控制供設計師與音樂人使用的專業軟體。最初的八個連接器涵蓋 3D 建模、視覺設計、音樂製作與現場表演,合作夥伴包括 Blender、Adobe、Autodesk、Ableton、Splice、Canva 的 Affinity、Resolume 以及 SketchUp。Blender 連接器由 Blender 官方團隊使用 MCP 協定開發,讓其他 AI 模型也能存取它。

GateNews5小時前
留言
0/400
暫無留言