騰訊首席 AI 科學家 姚舜毓 於 6 月 5 日在騰訊雲 AI 產業應用大會上首次公開亮相。在會中,他談到了公司的「混元 3」大型語言模型,並回應外界批評:騰訊在 AI 研發上落後了。姚舜毓 來自 OpenAI,現擔任混元模型團隊負責人,他同騰訊高級執行副總裁 唐道生 進行對談,圍繞 AI 模型策略、產品開發以及智慧代理(intelligent agents)的未來展開。這位 28 歲的科學家用「把 AI 競爭看作馬拉松而非衝刺」來回應外部的質疑,並表示世界不能只靠 ChatGPT 這樣的單一主流應用。
在會談中,姚舜毓 描述了混元 3 的三項核心改進。「其實沒有什麼秘密。今天做大型模型,在某種程度上是一件相當瑣碎的事情。我們應該把重點放在把基礎設施做好、把數據做好——演算法部分相對簡單」姚舜毓 表示。這些改進包括:重建整套用於預訓練與強化學習的基礎設施;更全面地升級數據與評測系統,更加強調定義真實問題並提升數據品質;以及在招聘、模型開發節奏與取捨之間做出以品味(taste)驅動的決策。
姚舜毓 在博士研究期間提出了 ReAct 架構,他強調模型開發中的許多決策是「以品味驅動」而非公式化。「很多決策其實是非常以品味驅動的」他在對談中反覆多次強調。他在 2019 年的博士論文《從下一個詞元預測到數位自動化》中,探討了 GPT-2 時代的語言代理。「當時還是 GPT-2 時代,它甚至不能生成連續的段落——有很多粗糙之處」姚舜毓 回憶。「但我當時覺得 GPT 是一個非常優雅的東西,而輸出下一個詞元是極其簡單卻又非常通用的任務。我相信有一天它不只是輸出下一個詞元,而是能把這個世界裡的一切都自動化。」
姚舜毓 指出,編碼代理(coding agents)是最關鍵的一種智慧代理形式,因為它們是圖靈完備(Turing-complete)。他概述了騰訊在代理開發方面的三段式策略:強調完整的系統設計、充分利用從產品線回流的數據,以及保持足夠的想像力以便探索。在模型開發策略上,姚舜毓 分享了三個方向:即使編碼成為最重要的主線,仍要維持完整的數據系統;透過共同設計(co-design)經驗來運用產品線回饋數據;並探索技術與產品演進中的下一個範式。
談到成本效益的取捨,姚舜毓 表示效能是成本效益的前提。「很多人會發現,使用一個強模型比使用一個差模型更便宜,因為它能更快把事情做對」他解釋。他指出,要用相對較小的模型達到強效能,並在多數任務上維持穩健表現,「或許在今天的中國更有價值」。
姚舜毓 於去年的一篇部落格文章中提出「AI 的下半場」概念,這個詞如今在業界被廣泛使用。他解釋這一概念的核心在於一次根本性的轉變:過去數十年 AI 研發聚焦在「找方法」,而如今方法學已經成熟,「找好問題」變得更加困難。「過去我們發明了像 AlphaGo 這樣能下圍棋的方法,但它只能下圍棋。我們做了專門的翻譯模型,但它只能做翻譯。但有了預訓練與後訓練,如今我們有一把通用鐵鎚,能敲任何一顆釘子」姚舜毓 說。「更難的其實是,找到值得解的好問題。」
姚舜毓 表示,騰訊龐大的產品矩陣與各種場景,能為 AI 技術提供真實的問題來源,這也是他加入騰訊的第二個原因。他將文化視為主要動機。「我第一次跟唐總和其他執行層領導聊天時,我的第一印象是大家對於『我們做得好的地方』和『我們做得不好的地方』都很誠實——非常直白、不遮遮掩掩」姚舜毓 說。「騰訊整體是建立在信任之上的運作,而不是建立在指標之上。這種坦率、低自我、務實的文化,加上對長期主義的承諾,對於打造一個長期的 AI 組織至關重要。」
依姚舜毓 看來,AI 下半場最重要的任務,是在中國建立一個以長期 AGI 為導向的組織。這個組織需要建構一個「均衡的三角形」:扎實的基礎技術、能創造價值的產品,以及面向前沿探索的精神。
姚舜毓 在對談中表示,AI 是一場長期賽跑,下半場才剛開始。「我不認為 ChatGPT 和 Claude Code 會是唯一的超級應用——那會是個非常悲觀的世界。今天就像 1970 年代個人電腦剛出現的時候——還有很多、很多事情需要做」姚舜毓 說。他預測未來會更為多元,而不是更為單一,他並指出:「編碼代理才剛剛開始,多模態、具身智慧(multimodal, embodied intelligence)——很多、很多新的事情才剛開始發生。」
「過去模型和產品經歷了大量探索,也走了不少彎路。我覺得這很正常」姚舜毓 表示。「更重要的是我們能否坦然面對自己,能否做到真實,能否看見回饋並進行改變,同時保持耐心。那就是下半場最重要的事情。」
唐道生 表示,騰訊歡迎外界的批評與建議。「我們是一家業務形態非常多元的公司。有時候我們可能快、有時候可能慢,也可能在某些領域失敗。但這是一場馬拉松,我們相信模型會持續迭代,用戶需求會持續變化,新的產品形態也會不斷出現」唐道生 說。
姚舜毓 在 6 月 5 日的騰訊大會上宣布了什麼?
姚舜毓,騰訊首席 AI 科學家,在 6 月 5 日的騰訊雲 AI 產業應用大會上,談論了混元 3 大型語言模型的開發路徑。他詳細說明三項核心改進:為預訓練與強化學習重建基礎設施、升級數據與評測系統,以及在招聘與模型開發之間落實以品味驅動的決策。姚舜毓 也透過將競爭定義為馬拉松而非衝刺,回應了外界對騰訊 AI 研發節奏的質疑。
姚舜毓 為什麼從 OpenAI 加入騰訊?
姚舜毓 在對談中表示,文化是他加入騰訊的主要原因。他描述自己對騰訊領導層的第一印象是「非常誠實」,而且「不遮遮掩掩、非常直白」。姚舜毓 說明,騰訊的運作建立在信任而非指標之上,並且有他認為對打造長期 AI 組織至關重要的「坦率、低自我、務實的文化」,以及對長期主義的承諾。他的第二個原因是:騰訊龐大的產品矩陣能為 AI 技術開發提供真實的問題來源。
相關新聞