D’après la PDG d’Abacus.AI, Bindu Reddy, Google prévoit de dévoiler Gemini 3.2 Flash lors de sa conférence I/O le 20 mai, avec des performances atteignant 92 % de celles de GPT-5.5 sur les tâches de codage et de raisonnement tout en réduisant les coûts d’inférence à seulement un quinzième à un vingtième de ceux-ci. La plupart des requêtes auront une latence inférieure à 200 millisecondes. Reddy a attribué cette percée aux techniques de distillation et de sparsité de Google, qui compressent un modèle de pointe dans la catégorie Flash sans la baisse de performance typique généralement observée lors de l’optimisation des modèles.
Related News
Des experts affirment que les preuves zk donnent un avantage aux DePIN alors que la demande de confiance liée à l’IA augmente
Google lance son premier « AI PC » : Googlebook intègre en profondeur Gemini, devenant le meilleur partenaire de collaboration
Google : de grands modèles de langage sont utilisés pour des attaques réelles, l'IA peut contourner les mécanismes de sécurité de double authentification