Tencent a discrètement publié Hunyuan Hy3 preview : le premier modèle phare après l'arrivée de Yao Shunyu.

ME News : le 23 avril (UTC+8), selon le suivi de Beating, Tencent a dévoilé son dernier modèle phare de la série Hunyuan, Hy3 preview, utilisant une architecture MoE (Mixture of Experts, activation de multiples petits réseaux experts à la demande), avec 295 milliards de paramètres totaux et 21 milliards de paramètres activés. Le modèle est déjà disponible via l’API OpenRouter et la démo HuggingFace, mais les poids open source n’ont pas encore été publiés. Il s’agit du premier modèle phare dirigé par Yao Shunyu, ancien chercheur d’OpenAI et scientifique en chef IA de Tencent, et le résultat de moins de trois mois après la reconstruction du système de R&D des modèles fondamentaux en février dernier. Tencent le positionne comme « comparable aux meilleurs modèles nationaux, mais toujours en retard par rapport aux modèles de pointe américains comme OpenAI et Google DeepMind ». Le modèle met l’accent sur les capacités agent, avec des optimisations spécifiques pour les outils agent courants comme OpenClaw, prenant en charge une fenêtre de contexte de 262,1K et un mode de raisonnement à trois niveaux. Il a déjà été déployé dans des produits Tencent tels que Yuanbao et CodeBuddy. (Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire