Menurut CEO Abacus.AI Bindu Reddy, Google berencana mengumumkan Gemini 3.2 Flash selama konferensi I/O pada 20 Mei, dengan performa mencapai 92% dari GPT-5.5 pada tugas coding dan penalaran sekaligus memangkas biaya inferensi menjadi hanya seperlima belas hingga seperdua puluh dari yang terakhir. Sebagian besar kueri akan memiliki latensi di bawah 200 milidetik. Reddy mengaitkan terobosan tersebut dengan teknik distilasi dan sparsity dari Google, yang mengompresi model frontier ke tingkat Flash tanpa tebing performa yang biasanya terlihat dalam optimasi model.
Related News
Para Pakar: Zk Proofs Memberi Keunggulan bagi DePIN saat Kebutuhan Kepercayaan untuk AI Meningkat
Google meluncurkan laptop AI pertamanya: Googlebook mengintegrasikan Gemini secara mendalam sebagai mitra kolaborasi terbaik
Google: Model bahasa besar digunakan untuk serangan dunia nyata, AI dapat melewati mekanisme keamanan autentikasi dua faktor