Menurut Yann LeCun dalam sebuah wawancara baru-baru ini, large language models tidak bisa mengarah pada artificial general intelligence meskipun nilainya, karena mereka tidak memiliki kemampuan untuk memprediksi konsekuensi tindakan dan merencanakan di ruang abstrak—kemampuan yang penting untuk penalaran setara manusia. LeCun menekankan bahwa keberhasilan LLM bergantung pada sifat diskrit bahasa, tetapi dunia nyata bersifat kontinu dan berdimensi tinggi, sehingga model perlu memahami kausalitas fisik, bukan sekadar memprediksi token berikutnya.
LeCun mengusulkan Joint Embedding Predictive Architecture (JEPA) sebagai alternatif, yang memprediksi status masa depan dalam ruang representasi semantik, bukan merekonstruksi piksel individu. Sebuah makalah Maret 2026 tentang LeWorldModel menunjukkan potensi JEPA: model dengan 15 juta parameter mencapai tingkat keberhasilan 96% pada tugas kontrol dan meningkatkan kecepatan perencanaan hingga 50 kali, tanpa memerlukan kumpulan data pralatihan besar-besaran.