Google Cloud Menampilkan Model Gemini 3.2 Flash Lite dengan Biaya Inferensi 95% Lebih Rendah Dibanding GPT-5.5

Berdasarkan pemantauan Beating.AI, opsi model baru bernama gemini-3.2-flash-lite-live-preview telah muncul di daftar pilihan model Google Cloud per 17 Mei. Sufiks “lite” dan “live” menandakan bahwa Google sedang membuat versi khusus yang dioptimalkan untuk interaksi real-time dengan latensi ultra-rendah.

CEO Abacus.AI Bindu Reddy sebelumnya mengungkapkan bahwa Gemini 3.2 Flash mencapai 92% dari kemampuan coding dan penalaran GPT-5.5, sekaligus menjaga biaya inferensi hanya 1/20 dari GPT-5.5, dengan sebagian besar kueri menghasilkan respons di bawah 200 milidetik. Pengamat industri memperkirakan model ringan yang dioptimalkan biaya ini akan diumumkan secara resmi di Google I/O pada 20 Mei.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar