Gate News melaporkan bahwa pada 17 Maret, Mistral AI hari ini merilis Leanstral, agen kode sumber terbuka pertama yang dirancang khusus untuk alat verifikasi formal Lean 4. Inovasi utama dari model ini adalah kemampuannya untuk menghasilkan kode AI sekaligus output bukti formal yang dapat diverifikasi secara otomatis oleh Lean 4, sehingga menghindari hambatan tradisional dalam proses peninjauan manual kode yang dihasilkan AI.
Leanstral menggunakan arsitektur MoE sparse, dengan total 120 miliar parameter dan 6 miliar parameter aktif, dirilis di bawah lisensi Apache 2.0, dan telah dioptimalkan melalui pelatihan khusus untuk lean-lsp-mcp. Pengguna dapat memulai tanpa konfigurasi melalui perintah /leanstall di Mistral Vibe, atau mengaksesnya melalui endpoint API gratis labs-leanstral-2603, serta mendownload bobot model untuk deployment mandiri.
Mistral juga merilis secara bersamaan standar evaluasi baru bernama FLTEval, yang menggunakan proyek formalisasi teorema besar Fermat dari komunitas Lean 4 sebagai skenario pengujian. Data perbandingan performa menunjukkan bahwa Leanstral pass@2 dengan biaya $36 mendapatkan skor 26,3, mengalahkan Claude Sonnet 4.6 yang biaya $549 dengan skor 23,7; pass@16 dengan biaya $290 mendapatkan skor 31,9, unggul 8 poin dari Sonnet 8, sementara Claude Opus 4.6 membutuhkan biaya $1.650 untuk mencapai skor 39,6. Di antara model sumber terbuka, Qwen3.5-397B-A17B perlu dijalankan 4 kali untuk mencapai skor 25,4, yang masih di bawah performa Leanstral pass@2.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Aave Labs meluncurkan Aave Checkpoint, peninjauan manual untuk mencegah risiko tata kelola DAO
Aave Labs merilis Aave Checkpoint pada 15 April, menggabungkan analisis otomatis berbasis AI dan verifikasi manual yang diwajibkan, serta mewajibkan setidaknya dua penguji untuk memvalidasi proposal tata kelola. Sistem ini telah beroperasi sejak Maret 2026, mencakup risiko DeFi seperti manipulasi oracle. Sejalan dengan itu, Aave V4 memperkenalkan modul reinvestasi, yang mengalokasikan likuiditas idle secara dinamis untuk menjaga likuiditas dana secara instan.
MarketWhisper1jam yang lalu
WLFI mengirimkan proposal penguncian aset, Sun Yuchen dan pendiri Moonrock Capital secara terbuka mengkritik
World Liberty Financial(WLFI)pada 15 April (Rabu) mengajukan proposal ke forum tata kelolanya, berniat mengunci token WLFI yang dimiliki investor awal selama dua tahun, lalu melepasnya secara bertahap dalam kurun waktu dua tahun tersebut; bagi pemegang yang tidak menerima rencana pembukaan (unlock) baru, token akan “tetap terkunci tanpa batas”, tindakan ini memicu kritik dari para investor utama seperti Justin Sun.
MarketWhisper1jam yang lalu
Ledger Meluncurkan Paket Keamanan AI pada 2026, Menampilkan Kontrol Berlabuh Perangkat Keras untuk Agen AI
Ledger memasuki pasar keamanan AI dengan perangkat keras baru untuk melindungi pengguna dari agen AI yang berbahaya. Dengan menekankan kebutuhan akan perlindungan di tingkat perangkat keras, perusahaan ini berencana untuk meluncurkan rangkaian teknologi yang bertujuan memastikan perilaku AI selaras dengan maksud manusia pada tahun 2026.
GateNews2jam yang lalu
Peningkatan Pi Network V23 untuk Meluncurkan Kontrak Pintar, Ekosistem DApp, dan DEX Bulan Depan
Pi Network akan meluncurkan peningkatan V23 pada bulan depan, dengan fitur smart contract, ekosistem DApp, dan pertukaran terdesentralisasi. Dengan lebih dari 18 juta pengguna yang diverifikasi KYC, peningkatan ini menggerakkan Pi menuju aplikasi praktis dan utilitas dalam ekosistemnya.
GateNews2jam yang lalu
CoW Swap Memulihkan Domain cow.fi Setelah Serangan Rekayasa Sosial pada 14 April
CoW Swap mendapatkan kembali kendali atas domain cow.fi-nya setelah serangan social engineering yang terjadi pada 14 April. Para penyerang menggunakan dokumen palsu untuk memanipulasi pencatat DNS dan menerapkan situs phishing. Pengguna yang terdampak insiden tersebut disarankan untuk mencabut persetujuan transaksi dan memindahkan dana.
GateNews4jam yang lalu
Aave Labs Meluncurkan Aave Checkpoint, Sistem Keamanan Tata Kelola Berbasis AI
Aave Labs telah meluncurkan Aave Checkpoint, sebuah sistem keamanan tata kelola yang digerakkan oleh AI untuk meninjau proposal dan payload on-chain, menggabungkan analisis otomatis dengan pengawasan manusia yang wajib. Beroperasi sejak Maret 2026, sistem ini mendukung Aave V3, V4, GHO, dan Aptos-v3.
GateNews4jam yang lalu