根据 Yann LeCun 在最近一次采访中的说法,尽管大语言模型很有价值,但它们无法带来人工通用智能,因为它们缺乏预测行动后果并在抽象空间中规划的能力——这些能力对真正的人类级推理至关重要。LeCun 强调,LLM 的成功依赖于语言的离散性,但现实世界是连续且高维的,需要模型理解物理因果性,而不仅仅是预测下一个 token。
LeCun 提出联合嵌入预测架构(JEPA)作为替代方案:它在语义表示空间中预测未来状态,而不是重建单个像素。2026 年 3 月的一篇关于 LeWorldModel 的论文展示了 JEPA 的潜力:一个 1500 万参数的模型在控制任务上实现了 96% 的成功率,并将规划速度最多提升了 50 倍,同时无需海量的预训练数据集。