Beating melaporkan bahwa Google telah merilis Gemma 4 12B, ukuran model baru dalam keluarga Gemma 4 yang dirancang untuk menjalankan agen AI multimodal secara lokal di laptop konsumen dengan RAM 16GB. Model 12B-parameter ini menggunakan arsitektur multimodal tanpa encoder yang mendukung input teks dan gambar, mengisi celah performa antara model yang lebih kecil dan yang lebih besar dalam jajaran keluarga tersebut.
Google juga secara bersamaan meningkatkan alat inferensi lokal LiteRT-LM dengan kompatibilitas OpenAI API, memungkinkan pengembang menghubungkan tools seperti Continue, Aider, dan Open WebUI langsung ke instans Gemma 4 12B yang berjalan secara lokal tanpa bergantung pada model berbasis cloud.