Google DeepMind merilis Gemma 4 12B, model AI multimodal open-source, hari ini. Model dengan 12 miliar parameter ini memberikan performa setara dengan model Mixture of Experts (MoE) berukuran lebih besar 26B, sekaligus membutuhkan memori kurang dari setengahnya, dan dapat dijalankan di laptop konsumen dengan hanya 16GB VRAM, termasuk perangkat MacBook Air M5 kelas pemula.
Gemma 4 12B adalah model berukuran menengah pertama dalam rangkaian Gemma 4 yang mendukung input audio secara native. Model ini memiliki arsitektur ringan tanpa encoder visi dan audio terpisah, sehingga memungkinkan latensi lebih rendah dan konsumsi memori yang lebih sedikit. Model ini mendukung penalaran multi-langkah, alur kerja Agent, serta inferensi lokal sepenuhnya offline. Model ini dirilis di bawah lisensi Apache 2.0 dengan bobot terlatih yang tersedia di Hugging Face dan Kaggle, serta dapat dideploy melalui platform Google Cloud termasuk Model Garden, Cloud Run, dan GKE.