AI 領袖在致遠會議上辯論模型差異化與中國「具身智能」的機會

在北京知源會議上,產業領袖就 AI 模型同質化疑慮展開辯論,因為頂尖模型的評測表現愈來愈趨於一致,且人們認為開源與閉源模型之間的差距僅有 3-6 個月。藍港創投(Bluerun Ventures)管理合夥人陳偉光、知源研究院院長王中源、Galaxy General 創辦人兼 CTO 王赫,以及 MiniMax 執行長李大海,則討論了大模型時代的長期價值來源。該座談會聚焦:AI 模型與具身智能產業是否正朝向同質化前進,以及持久性的競爭優勢究竟存在於何處。產業觀察者認為,在美中 AI 競爭中,人才是關鍵,具身智能代表了中國迎來如 AlphaGo 與 ChatGPT 類似突破時刻的機會。

知源會議產業領袖駁斥同質化疑慮

王中源表示,儘管各種大型模型排行榜令人眼花撩亂,而排行榜本身也並非完全可信,但那些敢於進行現場演示並進入真實場景的模型公司,展現了信心,並能在真實情境中找到資料閉環。他表示,整體大型模型性能迭代距離觸及瓶頸還很遠,技術路線並未收斂,未來可能出現多種模式,包括「一個超級強者配多個強力玩家」或「多個巨頭並肩站立」。王將「產業將走向同質化」的說法形容為過早。

Galaxy General 創辦人王赫則將討論從大型語言模型延伸到具身智能。他表示,大型語言模型本身仍有許多變數,多模態與影像、影片理解能力的不確定性更高。王將具身智能形容為目前處於「從 GPT-1 到 GPT-2 的階段」,而產業才剛進入加速期。

王赫描述具身智能的競爭護城河是完整的系統,涵蓋來源資料供給(合成資料、人類資料、機器人資料)、資料精煉能力、硬體迭代與軟硬體協同設計、模型吞吐融合能力,以及最終硬體交付能力。他將其形容為「六角戰士」的綜合系統,並表示全球範圍內並不存在此類成熟產品,護城河依然極深。

MiniMax 執行長李大海指出,Anthropic 的商業成功是直接反對同質化的證據。他表示,大型模型不能只是「T 型人才」——只具備一般性的橫向能力,還必須具備垂直方面的強項。李解釋,Anthropic 能成為全球現象,是因為它在通用模型基礎之上,把編碼能力打造到前所未有的水平,支撐了高估值與亮眼的商業表現。

李表示,大型模型正內化進系統演進,而非停留在孤立的技術要點。他表示,未來的模型最佳化必須與應用情境深度協同,類比引擎設計必須與整台車協同:在 F1 賽車與雜貨採買車上,最佳化方向完全不同。李表示,技術通用性與商業通用性必須分離,良好的商業化需要極致的情境特定模型最佳化,讓每家公司能透過找到正確方向來建立自己的護城河。

Galaxy General:具身智能處於從 GPT-1 到 GPT-2 的階段

王赫分享了 Galaxy General 以 WAM(World Action Model,世界行動模型)範式的實踐。在 WAM 範式出現之前,Galaxy General 曾使用 10 億幀的模擬資料,驗證在抓取技能方面的縮放可能性。公司開發了 GRASP-VLA,以達成對任意物體的零樣本抓取,且截至目前,尚沒有模型依賴真實遠端操控資料就能達到等同表現的水準。

王解釋,WAM 範式的出現,徹底打破了具身智能的資料瓶頸。傳統 VLA 模型需要帶有行動標籤的資料,且只能依賴機器人資料。WAM 以行動作為核心,透過未來預測進行視覺層級的行動規劃,且不需要行動標籤。這意味著機器人能直接從人類影片學習行為邏輯,而大量的人類影片資料就成為訓練材料。

王表示,Galaxy General 於 2025 年 3 月發表了全球首篇 WAM 論文,且在 2025 年 4 月,NVIDIA 具身智能實驗室主任 Jim Fan 表示:機器人的 endgame 是 WAM。王將具身智能的預訓練形容為進入爆發期,且資料取得不受限制。他表示,未來兩年內,具身智能將全面迎來自己的 GPT-3.5 時刻,而入場券是數千萬小時的高品質資料與數十億美元的資本投資。

多模態 AI 與具身智能開啟新的縮放路徑

王中源披露,去年產業對 Scaling Law(縮放定律)失敗的討論,源自對「網路預訓練資料已耗盡」的焦慮。過去兩年,後訓練、推理最佳化,以及 Agent 遞迴式自我演化,帶來了新一波能力提升。王表示,這不一定是模型參數本身增加,而是整個系統變得愈來愈有能力,AI 也正在從聊天工具轉變為執行工具。

作為研究院,知源正在探索下一階段的智能成長曲線。過去兩年,研究院在多模態領域驗證了縮放範式:Wujie Emu3 系列使用不到 1% 的多模態資料、且已擁有數十億參數,便已展現出明顯的效能提升。研究院如今也開始朝向面向物理世界的世界基礎模型推進,探索世界模型的縮放路徑。

李大海提出 MiniMax 的「知識密度定律」:整體大型模型智能 = 知識密度 × 參數數量。他披露,當去年為汽車公司部署邊緣模型時,他們只能達到 1B 參數;今年升級到 4B,明年可能將達到數十億參數。隨著量化技術進步、知識密度提高,量化之後更強的模型佔用與先前相同的資源,而邊緣模型的規模擴張才剛開始。

李表示,產業中許多階段性的結論往往壽命很短,因為開發會不斷推翻舊的認知。他表示,不僅邊緣模型有巨大的成長空間,大型語言模型的長上下文處理與低功耗最佳化仍具備遠未被完全探索的縮放潛力,產業仍遠未進入收斂階段。

座談會確認中國的供應鏈與人才優勢

王中源表示,AI 技術發展與自動駕駛遵循相同路徑:必然會經歷從擔憂與恐懼到適應與使用的過程,接著建立完整的治理體系與責任分配機制。當技術能帶來 3-5 倍的生產力提升,普及就無法被阻擋,而人類在經歷多輪技術浪潮後,也將找到對應的治理解決方案。

李大海表示,人的社會本質上是透過「從錯誤中學習」演進的——飛機安全規則與道路限速各自都在身後留下了痛苦的教訓。AI 技術將提升發現漏洞與修復問題的效率,大幅降低這項成本;產業也高度重視從創業階段起就建立安全底線,並由企業主動承擔社會責任。李表示,「從錯誤中學習」的模式或許很難完全避免,安全風險往往會從意想不到的面向出現,使得透過教訓改進規則成為一個必須面對的現實。

談到中國在 AI 上的差異化優勢,王中源表示,中國的供應鏈、製造優勢與龐大的國內市場,足以孵化並催化新技術的落地;而具身智能與世界模型很可能成為中國取得差異化領先的領域。

王赫堅定地表示,具身智能是中國的機會。他表達信念:具身智能的「AlphaGo 時刻」與「ChatGPT 時刻」都會在中國實現;他說,只要在中國完成零到一,就一定能在中國實現一到一百的成熟。

李大海補充,最核心的底層因素是:中國擁有全球最多的最聰明、最年輕的 AI 人才,這是最根本的優勢。再結合供應鏈、生態系統與情境優勢,中國一定能在 AI 領域取得重大進展。

常見問題

Galaxy General 表示具身智能已達到哪個階段?

Galaxy General 創辦人兼 CTO 王赫在北京知源會議上表示,具身智能目前處於「從 GPT-1 到 GPT-2 的階段」,產業才剛進入加速期。王表示,未來兩年內,具身智能將全面迎來自己的 GPT-3.5 時刻,而入場券是數千萬小時的高品質資料與數十億美元的資本投資。

座談會參與者如何回應 AI 模型同質化疑慮?

知源研究院院長王中源表示,整體大型模型性能迭代距離觸及瓶頸還很遠,技術路線尚未收斂,因而將同質化的說法視為過早。MiniMax 執行長李大海援引 Anthropic 在編碼能力方面的成功作為證據,認為公司可以透過垂直強項建立差異化。Galaxy General 的王赫則描述具身智能的競爭護城河是一個涵蓋資料供給、硬體迭代與模型能力的完整系統,並表示全球尚不存在此類成熟產品。

座談會認定中國在 AI 發展上有哪些優勢?

座談會參與者指出多項中國優勢。王中源提到,中國的供應鏈、製造優勢與龐大的國內市場足以催化新技術落地。李大海表示,中國擁有全球最多的最聰明、最年輕的 AI 人才,是最根本的優勢。王赫則表達信念:具身智能可媲美 AlphaGo 與 ChatGPT 的突破時刻將在中國實現;他說,只要在中國完成零到一,就一定能在中國實現一到一百的成熟。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆