圖靈獎得主 Yann LeCun 批評 LLM,提出 JEPA 框架作為通往 AGI 的路徑

根據 Yann LeCun 在最近一次訪談中的說法,雖然大型語言模型具備其價值,但它們無法導向人工通用智能,因為它們缺乏預測行動後果以及在抽象空間中進行規劃的能力——這些能力對真正的人類層級推理至關重要。LeCun 強調,LLM 的成功依賴於語言的離散性,但現實世界是連續且高維的,需要模型理解物理因果性,而不只是預測下一個 token。

LeCun 提出聯合嵌入預測架構(Joint Embedding Predictive Architecture,JEPA)作為替代方案:它在語意表徵空間中預測未來狀態,而不是重建單個像素。2026 年 3 月的一篇關於 LeWorldModel 的論文展示了 JEPA 的潛力:一個 1500 萬參數的模型在控制任務上達到 96% 的成功率,並且在規劃速度方面最高提升 50 倍,同時不需要龐大的預訓練資料集。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆