De acordo com a OneMillion_AI, a Mistral AI lançou recentemente o Leanstral 1.5, um modelo de demonstração formal para o Lean 4 com 119 mil milhões de parâmetros totais e 65 mil milhões de parâmetros ativos. O modelo é lançado sob a licença Apache-2.0 com acesso gratuito à API. No PutnamBench, o Leanstral 1.5 alcança um custo médio de aproximadamente 4 dólares por problema para resolver, significativamente mais baixo do que sistemas anteriores que custavam dezenas a centenas de dólares por problema.
O modelo resolve 587 de 672 problemas do PutnamBench e atinge 87% no benchmark de álgebra abstrata FATE-H e 34% no FATE-X, estabelecendo novos recordes de desempenho para a sua categoria. Para além de provas matemáticas, o Leanstral 1.5 foi também aplicado à verificação de código, descobrindo 11 bugs reais em 57 repositórios de código aberto Rust, com 5 anteriormente não reportados.