Mistral Merilis Leanstral 1.5 untuk Bukti Formal, Memotong Biaya menjadi ~$4 Per Masalah

Menurut OneMillion_AI, Mistral AI baru saja merilis Leanstral 1.5, sebuah model pembuktian formal untuk Lean 4 dengan total 119 miliar parameter dan 65 miliar parameter aktif. Model ini dirilis di bawah lisensi Apache-2.0 dengan akses API gratis. Pada PutnamBench, Leanstral 1.5 mencapai biaya rata-rata sekitar 4 dolar AS per masalah untuk dipecahkan, jauh lebih rendah dibandingkan sistem sebelumnya yang memakan biaya puluhan hingga ratusan dolar AS per masalah.

Model ini memecahkan 587 dari 672 masalah PutnamBench dan mencapai 87% pada tolok ukur aljabar abstrak FATE-H serta 34% pada FATE-X, mencetak rekor performa baru untuk kategorinya. Di luar pembuktian matematika, Leanstral 1.5 juga diterapkan pada verifikasi kode, menemukan 11 bug nyata di 57 repositori Rust sumber terbuka, dengan 5 di antaranya belum pernah dilaporkan sebelumnya.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar