Selon OneMillion_AI, Mistral AI a récemment publié Leanstral 1.5, un modèle de preuve formelle pour Lean 4 avec 119 milliards de paramètres au total et 65 milliards de paramètres actifs. Le modèle est publié sous licence Apache-2.0 avec un accès gratuit à l'API. Sur PutnamBench, Leanstral 1.5 atteint un coût moyen d'environ 4 dollars par problème résolu, nettement inférieur aux systèmes antérieurs qui coûtaient des dizaines à des centaines de dollars par problème.
Le modèle résout 587 problèmes sur 672 dans PutnamBench et atteint 87 % sur le benchmark d'algèbre abstraite FATE-H et 34 % sur FATE-X, établissant de nouveaux records de performance pour sa catégorie. Au-delà des preuves mathématiques, Leanstral 1.5 a également été appliqué à la vérification de code, découvrant 11 bugs réels dans 57 dépôts open-source Rust, dont 5 non signalés auparavant.