A Google DeepMind lançou hoje o Gemma 4 12B, um modelo de IA multimodal open-source. O modelo com 12 mil milhões de parâmetros oferece um desempenho comparável ao do seu modelo Mixture of Experts de 26B, exigindo ao mesmo metade da memória, e pode ser executado em portáteis de consumo com apenas 16GB de VRAM, incluindo dispositivos entry-level MacBook Air M5.
O Gemma 4 12B é o primeiro modelo intermédio da série Gemma 4 a suportar entrada de áudio nativa. O modelo tem uma arquitectura leve sem codificadores separados de visão e de áudio, permitindo menor latência e menor consumo de memória. Suporta raciocínio em múltiplos passos, fluxos de trabalho de Agent e inferência local totalmente offline. O modelo é disponibilizado sob a licença Apache 2.0, com pesos pré-treinados disponíveis no Hugging Face e no Kaggle, e pode ser implementado através de plataformas da Google Cloud, incluindo Model Garden, Cloud Run e GKE.