De acordo com Beating, o Google lançou o Gemma 4 12B, um novo tamanho de modelo na família Gemma 4, desenvolvido para executar agentes de IA multimodais localmente em laptops de consumidores com 16GB de RAM. O modelo com 12B parâmetros usa uma arquitetura multimodal sem encoder que aceita entradas de texto e imagem, preenchendo uma lacuna de desempenho entre os modelos menores e os maiores da linha.
O Google também atualizou simultaneamente sua ferramenta de inferência local LiteRT-LM com compatibilidade com a API da OpenAI, permitindo que desenvolvedores conectem ferramentas como Continue, Aider e Open WebUI diretamente a uma instância local do Gemma 4 12B, sem depender de modelos baseados na nuvem.