根據 Beating,Google 已釋出 Gemma 4 12B,這是一款 Gemma 4 系列中的新模型規模,旨在讓多模態 AI 代理程式可在消費級筆記型電腦上本機運行,且僅需 16GB 記憶體。這個 12B 參數的模型採用無編碼器(encoder-free)的多模態架構,支援文字與圖片輸入,填補了該系列陣容中較小模型與較大模型之間的效能落差。
Google 同步也為其 LiteRT-LM 本地推論工具升級了與 OpenAI API 的相容性,讓開發者能將 Continue、Aider 和 Open WebUI 等工具直接連接到本機運行的 Gemma 4 12B 實例,而無需依賴雲端式模型。