Google DeepMind a publié aujourd’hui Gemma 4 12B, un modèle d’IA multimodal open source. Le modèle de 12 milliards de paramètres offre des performances comparables à son modèle Mixture of Experts de 26B plus large, tout en nécessitant moins de la moitié de la mémoire, et peut fonctionner sur des ordinateurs portables grand public avec seulement 16GB de VRAM, y compris des MacBook Air M5 d’entrée de gamme.
Gemma 4 12B est le premier modèle de taille intermédiaire de la série Gemma 4 à prendre en charge l’entrée audio native. Le modèle présente une architecture légère sans encodeurs séparés vision et audio, permettant une latence plus faible et une consommation mémoire réduite. Il prend en charge le raisonnement multi-étapes, les workflows d’Agent et l’inférence locale entièrement hors ligne. Le modèle est publié sous licence Apache 2.0, avec des poids pré-entraînés disponibles sur Hugging Face et Kaggle, et peut être déployé via des plateformes Google Cloud, notamment Model Garden, Cloud Run et GKE.