Microsoft dévoile sept modèles d’IA revendiquant un avantage sur Claude et Nano Banana

Microsoft a dévoilé sept nouveaux modèles d’IA lors de son événement annuel Build mardi, affirmant qu’ils surpassaient Claude Sonnet 4.6 d’Anthropic et Nano Banana 2 de Google dans des tests à l’aveugle et des références de retouche d’images. Le lancement s’inscrit dans la volonté de Microsoft de s’imposer comme développeur d’IA de pointe, plutôt que comme seul plus grand soutien et fournisseur d’infrastructure d’OpenAI. L’annonce intervient alors que la concurrence entre les principaux développeurs d’IA s’intensifie, Anthropic et Google ayant récemment publié leurs propres modèles phares.

MAI-Thinking-1 surpasse Claude Sonnet 4.6 dans des tests à l’aveugle

MAI-Thinking-1, le modèle phare de fondation en texte de Microsoft, a été jugé supérieur à Claude Sonnet 4.6 d’Anthropic dans des tests à l’aveugle menés par des évaluateurs indépendants, selon le PDG de l’IA chez Microsoft, Mustafa Suleyman. Le modèle a obtenu 97% à l’AIME 2025, un benchmark mesurant des compétences avancées de résolution de problèmes et de raisonnement. Suleyman a déclaré que le résultat de MAI sur SWE Bench Pro le place « juste à côté d’Opus 4.6 sur l’un des benchmarks de codage les plus difficiles ». Microsoft a aussi affirmé que MAI « a délivré le taux de victoire le plus élevé, en surpassant GPT-5.5 en qualité, tout en étant 10x moins coûteux ».

« Très enthousiaste pour annoncer aujourd’hui sept nouveaux modèles MAI de niveau mondial », a écrit Suleyman sur X. « Ils représentent, selon nous, une nouvelle ère de l’IA conçue pour vous garder aux commandes et à la pointe. »

Microsoft lance six modèles d’IA supplémentaires dans les catégories de codage, d’images et de voix

Microsoft a introduit MAI-Code-1-Flash, un modèle de codage léger conçu pour GitHub Copilot et Visual Studio Code. La société a également dévoilé MAI-Image-2.5 et sa variante Flash, que Microsoft dit surpasser Nano Banana Pro de Google sur des tâches de retouche d’images. MAI Transcribe-1.5, un modèle de transcription prenant en charge 43 langues, et MAI-Voice-2, un modèle de génération de la parole capable de produire des voix au son naturel dans 15 langues et de s’adapter à la voix d’un locuteur à partir d’un bref échantillon audio, ont également été annoncés.

« C’est une période extraordinaire pour la technologie. La puissance de calcul utilisée pour entraîner des modèles de pointe a été multipliée par un trillion », a déclaré Suleyman dans un billet de blog annonçant les nouveaux modèles. « Nous nous attendons maintenant à une nouvelle hausse de mille fois au cours des trois prochaines années, ce qui signifie à son tour davantage de capacités avancées et la poursuite du déploiement d’une IA toujours plus efficace. »

Anthropic et Google publient des modèles en concurrence

La semaine dernière, Anthropic a annoncé le lancement d’Opus 4.8, que la société a présenté comme plus rapide et plus intelligent sur ses tests de benchmark, avec de nouvelles fonctionnalités. Mardi, Anthropic a annoncé l’extension de son projet Project Glasswing, offrant à 150 entreprises l’accès à son modèle Mythos, axé sur la cybersécurité. Lors du Google I/O en mai, Google a dévoilé Gemini Omni, un modèle d’IA multimodal combinant Gemini avec les modèles de génération média Veo, Nano Banana et Genie, ainsi que Gemini Spark, un agent d’IA basé dans le cloud conçu pour gérer des tâches entre applications et workflows.

« Les développeurs et les entreprises ont demandé une IA qui répond à leurs conditions et selon leurs choix », a écrit Suleyman. « Nous y voyons une étape majeure vers la réalisation de cela. »

FAQ

Qu’a annoncé Microsoft lors de l’événement Build mardi ?
Microsoft a dévoilé sept nouveaux modèles d’IA, dont MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5, MAI Transcribe-1.5 et MAI-Voice-2, affirmant qu’ils surpassaient Claude Sonnet 4.6 d’Anthropic et Nano Banana 2 de Google dans divers benchmarks.

Comment MAI-Thinking-1 s’est-il comporté sur les benchmarks ?
MAI-Thinking-1 a obtenu 97% sur l’AIME 2025 et a été préféré à Claude Sonnet 4.6 lors de tests à l’aveugle menés par des évaluateurs indépendants, selon le PDG de l’IA chez Microsoft, Mustafa Suleyman.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire