D’après la CCTV, la plateforme d’agrégation de modèles de grand langage de China Mobile a officiellement été lancée le 8 mai, en intégrant plus de 300 modèles d’IA nationaux — la plus grande collection de ce type en Chine. La plateforme utilise un modèle d’optimisation de jetons qui associe automatiquement les tâches au modèle le plus adapté en fonction des priorités de l’utilisateur : efficacité des coûts, performance ou approche équilibrée. Lorsque les modèles rencontrent des dépassements de délai ou des échecs, la plateforme permet une reprise automatique en quelques secondes. La plateforme a obtenu une réduction de 30% des coûts par jeton, réduit la consommation de ressources de plus de 50% et traite plus de 1 billion d’appels par jour.
Related News
Les GPT-5.5-Cyber d’OpenAI pour armer les défenseurs de la cybersécurité
FMI : l’IA représente une menace potentielle pour la stabilité financière
OpenAI lance GPT-Realtime-2 : intègre l’inférence de GPT-5 dans les agents vocaux et fait passer le contexte à 128K