A Google DeepMind lançou hoje a Gemma 4 12B, um modelo de IA multimodal de código aberto. O modelo com 12 bilhões de parâmetros oferece desempenho comparável ao seu modelo Mixture of Experts de 26B maior, ao mesmo tempo em que exige menos da metade da memória, e pode rodar em laptops de consumo com apenas 16GB de VRAM, incluindo dispositivos MacBook Air M5 de entrada.
A Gemma 4 12B é o primeiro modelo intermediário da série Gemma 4 a oferecer suporte nativo à entrada de áudio. O modelo traz uma arquitetura leve, sem encoders separados de visão e áudio, o que permite menor latência e redução no consumo de memória. Ele suporta raciocínio em múltiplas etapas, fluxos de trabalho de Agentes e inferência local totalmente offline. O modelo é lançado sob a licença Apache 2.0, com pesos pré-treinados disponíveis no Hugging Face e no Kaggle, e pode ser implantado via plataformas do Google Cloud, incluindo Model Garden, Cloud Run e GKE.