騰訊首席 AI 科學家姚舜毓於 6 月 5 日在騰訊雲 AI 產業應用大會上首次公開亮相。在會中，他談到了公司的「混元 3」大型語言模型，並回應外界批評：騰訊在 AI 研發上落後了。姚舜毓來自 OpenAI，現擔任混元模型團隊負責人，他同騰訊高級執行副總裁唐道生進行對談，圍繞 AI 模型策略、產品開發以及智慧代理（intelligent agents）的未來展開。這位 28 歲的科學家用「把 AI 競爭看作馬拉松而非衝刺」來回應外部的質疑，並表示世界不能只靠 ChatGPT 這樣的單一主流應用。

姚舜毓詳述混元 3 的開發路徑

在會談中，姚舜毓描述了混元 3 的三項核心改進。「其實沒有什麼秘密。今天做大型模型，在某種程度上是一件相當瑣碎的事情。我們應該把重點放在把基礎設施做好、把數據做好——演算法部分相對簡單」姚舜毓表示。這些改進包括：重建整套用於預訓練與強化學習的基礎設施；更全面地升級數據與評測系統，更加強調定義真實問題並提升數據品質；以及在招聘、模型開發節奏與取捨之間做出以品味（taste）驅動的決策。

姚舜毓在博士研究期間提出了 ReAct 架構，他強調模型開發中的許多決策是「以品味驅動」而非公式化。「很多決策其實是非常以品味驅動的」他在對談中反覆多次強調。他在 2019 年的博士論文《從下一個詞元預測到數位自動化》中，探討了 GPT-2 時代的語言代理。「當時還是 GPT-2 時代，它甚至不能生成連續的段落——有很多粗糙之處」姚舜毓回憶。「但我當時覺得 GPT 是一個非常優雅的東西，而輸出下一個詞元是極其簡單卻又非常通用的任務。我相信有一天它不只是輸出下一個詞元，而是能把這個世界裡的一切都自動化。」

姚舜毓指出，編碼代理（coding agents）是最關鍵的一種智慧代理形式，因為它們是圖靈完備（Turing-complete）。他概述了騰訊在代理開發方面的三段式策略：強調完整的系統設計、充分利用從產品線回流的數據，以及保持足夠的想像力以便探索。在模型開發策略上，姚舜毓分享了三個方向：即使編碼成為最重要的主線，仍要維持完整的數據系統；透過共同設計（co-design）經驗來運用產品線回饋數據；並探索技術與產品演進中的下一個範式。

談到成本效益的取捨，姚舜毓表示效能是成本效益的前提。「很多人會發現，使用一個強模型比使用一個差模型更便宜，因為它能更快把事情做對」他解釋。他指出，要用相對較小的模型達到強效能，並在多數任務上維持穩健表現，「或許在今天的中國更有價值」。

騰訊對 AGI 的組織要求下定義

姚舜毓於去年的一篇部落格文章中提出「AI 的下半場」概念，這個詞如今在業界被廣泛使用。他解釋這一概念的核心在於一次根本性的轉變：過去數十年 AI 研發聚焦在「找方法」，而如今方法學已經成熟，「找好問題」變得更加困難。「過去我們發明了像 AlphaGo 這樣能下圍棋的方法，但它只能下圍棋。我們做了專門的翻譯模型，但它只能做翻譯。但有了預訓練與後訓練，如今我們有一把通用鐵鎚，能敲任何一顆釘子」姚舜毓說。「更難的其實是，找到值得解的好問題。」

姚舜毓表示，騰訊龐大的產品矩陣與各種場景，能為 AI 技術提供真實的問題來源，這也是他加入騰訊的第二個原因。他將文化視為主要動機。「我第一次跟唐總和其他執行層領導聊天時，我的第一印象是大家對於『我們做得好的地方』和『我們做得不好的地方』都很誠實——非常直白、不遮遮掩掩」姚舜毓說。「騰訊整體是建立在信任之上的運作，而不是建立在指標之上。這種坦率、低自我、務實的文化，加上對長期主義的承諾，對於打造一個長期的 AI 組織至關重要。」

依姚舜毓看來，AI 下半場最重要的任務，是在中國建立一個以長期 AGI 為導向的組織。這個組織需要建構一個「均衡的三角形」：扎實的基礎技術、能創造價值的產品，以及面向前沿探索的精神。

姚舜毓與唐道生於大會上回應節奏質疑

姚舜毓在對談中表示，AI 是一場長期賽跑，下半場才剛開始。「我不認為 ChatGPT 和 Claude Code 會是唯一的超級應用——那會是個非常悲觀的世界。今天就像 1970 年代個人電腦剛出現的時候——還有很多、很多事情需要做」姚舜毓說。他預測未來會更為多元，而不是更為單一，他並指出：「編碼代理才剛剛開始，多模態、具身智慧（multimodal, embodied intelligence）——很多、很多新的事情才剛開始發生。」

「過去模型和產品經歷了大量探索，也走了不少彎路。我覺得這很正常」姚舜毓表示。「更重要的是我們能否坦然面對自己，能否做到真實，能否看見回饋並進行改變，同時保持耐心。那就是下半場最重要的事情。」

唐道生表示，騰訊歡迎外界的批評與建議。「我們是一家業務形態非常多元的公司。有時候我們可能快、有時候可能慢，也可能在某些領域失敗。但這是一場馬拉松，我們相信模型會持續迭代，用戶需求會持續變化，新的產品形態也會不斷出現」唐道生說。

常見問題

姚舜毓在 6 月 5 日的騰訊大會上宣布了什麼？

姚舜毓，騰訊首席 AI 科學家，在 6 月 5 日的騰訊雲 AI 產業應用大會上，談論了混元 3 大型語言模型的開發路徑。他詳細說明三項核心改進：為預訓練與強化學習重建基礎設施、升級數據與評測系統，以及在招聘與模型開發之間落實以品味驅動的決策。姚舜毓也透過將競爭定義為馬拉松而非衝刺，回應了外界對騰訊 AI 研發節奏的質疑。

姚舜毓為什麼從 OpenAI 加入騰訊？

姚舜毓在對談中表示，文化是他加入騰訊的主要原因。他描述自己對騰訊領導層的第一印象是「非常誠實」，而且「不遮遮掩掩、非常直白」。姚舜毓說明，騰訊的運作建立在信任而非指標之上，並且有他認為對打造長期 AI 組織至關重要的「坦率、低自我、務實的文化」，以及對長期主義的承諾。他的第二個原因是：騰訊龐大的產品矩陣能為 AI 技術開發提供真實的問題來源。

View Source

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。

騰訊 AI 首席姚順宇在 6 月 5 日的會議上為開發步伐辯護

姚舜毓 詳述混元 3 的開發路徑

騰訊 對 AGI 的組織要求下定義

姚舜毓 與 唐道生 於大會上回應節奏質疑

常見問題

姚舜毓詳述混元 3 的開發路徑

騰訊對 AGI 的組織要求下定義

姚舜毓與唐道生於大會上回應節奏質疑