Segundo o Beating, a Google lançou a Gemma 4 12B, um novo tamanho de modelo na família Gemma 4, concebido para executar agentes de IA multimodais localmente em computadores portáteis de consumo com 16GB de RAM. O modelo de 12B parâmetros utiliza uma arquitetura multimodal sem codificador que suporta entradas de texto e imagem, colmatando a lacuna de desempenho entre os modelos mais pequenos e os maiores da linha.
Em simultâneo, a Google atualizou a ferramenta de inferência local LiteRT-LM com compatibilidade com a API da OpenAI, permitindo que os programadores liguem ferramentas como Continue, Aider e Open WebUI diretamente a uma instância local da Gemma 4 12B, sem depender de modelos baseados na cloud.