Le PDG de MiniMax Intelligence, Li Dahai, a déclaré lors de la conférence 2026 Beijing Zhiyuan que la technologie d’agents exige une approche mesurée malgré l’accélération des progrès. S’adressant à Pengpai News et à d’autres médias, Li a expliqué que les attentes du public envers des agents sans aucune erreur dépassent ce que la courbe actuelle du développement technique peut livrer, la technologie devant encore arriver à maturité. Il a identifié 2025 comme la première année des agents, anticipant une croissance explosive qui aura un impact profond sur la société humaine, tout en soulignant la nécessité d’une évaluation sereine des capacités techniques actuelles dans l’espace des agents IA.
Li Dahai a reconnu que l’intégration des grands modèles et de la technologie d’agents évolue rapidement, certaines scénarios étant déjà passés à des applications concrètes. En abordant les limites des agents, Li a déclaré sans détour : « Des problèmes partout. » Il a précisé que « l’évolution des modèles et de la technologie d’agents est très rapide », expliquant que « peut-être qu’aujourd’hui certains travaux ont un taux d’erreur de 10 %, et que le mois prochain le taux d’erreur tombe à 1 % — l’évolution rapide est devenue une tendance fondamentale ».
Li Dahai a directement contesté la croyance répandue dans l’industrie selon laquelle « la fabrication de bons petits modèles doit provenir de la distillation de modèles de base ultra-grande échelle », en la qualifiant de « mésinterprétation cognitive ». Il a expliqué : « Derrière la distillation, il y a une prémisse très précise : l’objet de la distillation lui-même doit être un bon modèle. La distillation consiste essentiellement en ceci : pour des entreprises qui n’ont pas la capacité de développer elles-mêmes des modèles de base, mais qui veulent faire aboutir des applications, elles adoptent des modèles de base existants de petite taille et obtiennent des capacités spécifiques à des scénarios grâce au fine-tuning. Dans ce processus, elles peuvent effectivement utiliser d’autres grands modèles pour synthétiser des données afin de permettre aux petits modèles d’acquérir des capacités correspondantes. » Li a indiqué que c’est le paradigme de tout entraînement de grands modèles, et qu’il ne se limite pas aux petits modèles.
Li Dahai a révélé : « Depuis cette année, à mesure que l’ensemble de l’industrie a basculé l’inférence vers des puces domestiques, nous transférons aussi progressivement l’entraînement vers des puces domestiques et des clusters domestiques. » Il a identifié deux voies parallèles pour améliorer l’écosystème de calcul domestique : la première est l’amélioration par le bas (bottom-up), où les entreprises de grands modèles améliorent progressivement l’écosystème via leurs propres pratiques d’entraînement, « comme mouiller une dalle de pierre morceau par morceau, ce qui prend du temps ». La deuxième voie est la planification par le haut (top-down), illustrée par la coopération approfondie de MiniMax avec l’Institut de recherche Zhiyuan sur l’écosystème logiciel FlagOS, où les entreprises de grands modèles et les entreprises de puces établissent une coopération étroite et avancent dans un cadre planifié. Li Yuxuan, responsable de l’AIInfra chez MiniMax Intelligence, a noté que l’inférence nécessite en réalité une précision plus élevée que l’entraînement, et que la technologie d’échelle de modèle proposée par MiniMax est devenue une percée clé : obtenir l’effet de prédire de grands modèles avec des modèles très petits, fournir une évaluation approfondie sur des puces domestiques, aligner les détails expérimentaux avec les fabricants à l’étranger, et confirmer que la précision d’entraînement est exploitable. MiniMax a révélé avoir atteint un entraînement avec quantification-aware sur une largeur de bits extrêmement faible sur la plateforme de Huawei, atteignant 95 % de l’efficacité d’un entraînement ordinaire. Li Dahai a expliqué que la perte de 5 % vient de la surcharge du quantificateur lui-même, et qu’au moyen d’une coopération approfondie avec Huawei, cette surcharge a été optimisée au minimum.
MiniMax Intelligence a annoncé que la version 1B de la MiniCPM Small Cannon, cinquième génération, a obtenu un score de 17,9 sur l’évaluation faisant autorité ArtificialAnalysis (AA). Des chercheurs de la communauté open-source ont comparé et constaté que GPT-4o (200 milliards de paramètres), publié en mai 2024, a obtenu 18,3-18,6 sur le même type d’évaluation, avec seulement un écart de 0,4-0,7 point entre les deux. Li Dahai a déclaré : « En 2024, nous avons prédit qu’à la fin de 2026, le niveau d’intelligence des modèles en périphérie pourrait atteindre le niveau de GPT-4. D’après les données actuelles, cet objectif a été atteint avec de l’avance. »
Pendant la précédente « MiniMax Open Source Week », MiniMax Intelligence a publié deux grands modèles en périphérie : MiniCPM5-1B et BitCPM-CANN. MiniCPM5-1B a de nouveau repoussé la limite supérieure de densité d’intelligence des modèles : avec seulement une échelle de 1 milliard de paramètres, il a dépassé tous les modèles inférieurs à 2 milliards de paramètres sur le célèbre classement AA-Index international ; par rapport à Qwen3.5-2B publié 3 mois plus tôt, MiniCPM5-1B a non seulement de meilleures performances, mais a aussi réduit les paramètres de moitié.
Le modèle MiniCPM5-1B a été pré-entraîné par le framework d’entraînement IA ForgeTrain, développé en interne par MiniMax Intelligence. Il s’agit du premier framework de pré-entraînement de grands modèles de qualité production au monde, entièrement écrit par une IA, sans participation de programmeur humain. La vitesse d’entraînement est 10 % plus rapide que NVIDIA Megatron.
Que a dit Li Dahai à propos des limites de la technologie d’agents lors de la conférence 2026 Beijing Zhiyuan ?
Li Dahai a déclaré que les attentes du public envers des agents sans erreurs dépassent ce que la courbe actuelle du développement technique peut offrir, et que la technologie a encore besoin de temps pour mûrir. Il a décrit les limites actuelles des agents comme « des problèmes partout », tout en soulignant que les taux d’erreur baissent rapidement — de 10 % à 1 % en l’espace d’un mois dans certains cas.
Comment la performance de MiniCPM-5 1B se compare-t-elle à GPT-4o sur le benchmark ArtificialAnalysis ?
MiniCPM-5 1B (avec 1 milliard de paramètres) a obtenu 17,9 sur l’évaluation ArtificialAnalysis, tandis que GPT-4o (avec 200 milliards de paramètres, publié en mai 2024) a obtenu 18,3-18,6 sur la même évaluation, ce qui représente une différence de seulement 0,4-0,7 point entre les deux modèles.
Qu’est-ce que ForgeTrain et comment se compare-t-il à NVIDIA Megatron ?
ForgeTrain est le framework d’entraînement IA développé en interne par MiniMax Intelligence, qui constitue le premier framework de pré-entraînement de grands modèles de qualité production au monde, entièrement écrit par une IA, sans participation de programmeur humain. Il entraîne 10 % plus vite que NVIDIA Megatron.
Actualités associées
Le PDG de Microsoft : la « douve » de l’IA est un cycle d’apprentissage en boucle fermée, et les entreprises ne peuvent pas externaliser l’apprentissage
Le PDG de SpaceX déclare que la fusion avec Tesla est envisageable, intégrant les centres de données d’IA et l’activité de puces
Le cofondateur d'Animoca, Siu, déclare que la créativité sera la compétence la plus recherchée à l’ère de l’IA
ChatGPT Pro fournit une valeur en IA de 14 000 dollars dans un test d’abonnement à Semianalysis
Ripple, MetaMask, Mastercard construisent une infrastructure de paiement pour agents IA