Beating menyatakan bahwa Google Gemini 3.1 Flash-Lite beralih dari pratinjau ke ketersediaan umum (GA) pada 8 Mei, menjadi model termurah dan tercepat dalam lini Gemini 3. Harga input ditetapkan $0,25 per 1 juta token dan output $1,50 per 1 juta token—biaya input 75% lebih rendah daripada Claude 4.5 Haiku ($1,00) dan biaya output 70% lebih rendah ($5,00). Model ini memiliki jendela konteks 1 juta token dan mencapai throughput 363 token per detik, 45% lebih cepat dibanding pendahulunya Gemini 2.5 Flash.
Benchmark kinerja menunjukkan GPQA Diamond (penalaran sains tingkat pascasarjana) sebesar 86,9%, melampaui Claude 4.5 Haiku 73,0% dan GPT-5 mini 82,3%. MMMU-Pro (penalaran multimodal) mencapai 76,8%. Pengadopsi awal termasuk platform layanan pelanggan Gladly, yang melaporkan penurunan biaya 60% dan tingkat keberhasilan 99,6% pada beban kerja produksi, serta JetBrains, yang mengintegrasikan Flash-Lite ke dalam alat bantu IDE.
Related News