В недавнем интервью Ян Лекун заявил, что большие языковые модели не могут привести к искусственному общему интеллекту, несмотря на их ценность, поскольку они не способны предсказывать последствия действий и планировать в абстрактном пространстве — возможностях, необходимых для подлинных рассуждений на уровне человека. Лекун подчеркнул, что успех LLM опирается на дискретную природу языка, однако реальный мир непрерывен и многомерен, поэтому моделям нужно понимать физическую причинность, а не просто предсказывать следующий токен.
Лекун предлагает в качестве альтернативы архитектуру Joint Embedding Predictive Architecture (JEPA): она предсказывает будущие состояния в семантическом представлении, а не восстанавливает отдельные пиксели. Публикация за март 2026 года о LeWorldModel продемонстрировала потенциал JEPA: модель с 15-миллионами параметров показала 96% успешных результатов на задачах управления и ускорила планирование до 50 раз, без необходимости в массивных наборах данных для предварительного обучения.