Message d’actualité de Gate, 24 avril — DeepSeek a publié la série V4 de modèles open-source sous la licence MIT, avec des poids désormais disponibles sur Hugging Face et ModelScope. La série comprend deux modèles (MoE) de type mixture-of-experts : V4-Pro avec 1,6 billion de paramètres au total et 49 milliards activés par jeton, et V4-Flash avec 284 milliards de paramètres au total et 13 milliards activés par jeton. Les deux prennent en charge une fenêtre de contexte d’1 million de jetons.
L’architecture présente trois mises à niveau clés : un mécanisme d’attention hybride combinant l’attention clairsemée compressée (CSA) et l’attention fortement compressée (HCA) qui réduit considérablement la surcharge pour les longs contextes — pour V4-Pro, les FLOPs d’inférence pour un contexte de 1M ne sont que 27 % de ceux de V3.2, et le cache KV (VRAM destiné au stockage d’informations historiques pendant l’inférence) n’est que 10 % de celui de V3.2 ; des hyperconnexions à contraintes de manifold (mHC) remplaçant les connexions résiduelles traditionnelles afin d’améliorer la stabilité de la propagation du signal entre les couches ; et l’optimiseur Muon pour une convergence d’entraînement plus rapide. Le préentraînement a utilisé plus de 32 trillions de jetons de données.
Le post-entraînement emploie une approche en deux étapes : d’abord entraîner des experts spécifiques au domaine via un fine-tuning supervisé (SFT) et l’apprentissage par renforcement GRPO, puis les fusionner en un seul modèle grâce à une distillation en ligne. V4-Pro-Max (plus haut mode d’inférence) affirme être le modèle open-source le plus puissant, avec des benchmarks de codage de premier plan et des écarts nettement réduits par rapport aux modèles de pointe propriétaires sur les tâches de raisonnement et d’agents. V4-Flash-Max atteint des performances de raisonnement de niveau Pro avec un budget de calcul suffisant, mais est limité par l’échelle des paramètres sur les tâches de connaissance pure et les tâches d’agents complexes. Les poids sont stockés dans une précision mixte FP4+FP8.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Les entreprises chinoises d’IA envisagent de démanteler les structures « red-chip » après la suspension de l’acquisition de Manus par Meta
D’après Beating, la Commission nationale du développement et de la réforme chinoise a stoppé l’acquisition de 2 milliards de dollars de Meta visant la société d’agents IA Manus, amenant la Commission chinoise de régulation des valeurs mobilières à durcir l’approbation des inscriptions en IPO à Hong Kong par les entreprises « red-chip » (sociétés chinoises détenant des actifs nationaux th
GateNewsIl y a 11m
Musk termine un témoignage de trois jours dans le procès contre OpenAI, citant une demande de dommages et intérêts de 130 à 150 milliards de dollars
D’après plusieurs médias, Elon Musk a achevé trois jours de témoignage dans son procès contre OpenAI les 28-30 avril, avec un temps de témoignage cumulé de plus de 7 heures. Musk, qui a cofondé OpenAI en 2015 avec un investissement initial de 38 millions de dollars, a affirmé que l’entreprise a abandonné sa mission à but non lucratif m
GateNewsIl y a 21m
Meta acquiert la startup d’IA robotique Assured Robot Intelligence le 1er mai
Selon Bloomberg, Meta a acquis Assured Robot Intelligence, une startup d’IA et de robotique basée à San Diego et à New York, le 1er mai. L’équipe acquise, y compris les cofondateurs Lerrel Pinto et Xiaolong Wang, rejoindra Meta Superintelligence Labs et travaillera avec Meta Robotics Studio. Financier
GateNewsIl y a 21m
Une organisation liée à OpenAI verse 5 000 dollars par TikTok à des influenceurs pour diffuser un message de « menace de l’IA chinoise »
D’après WIRED, l’organisation à but non lucratif Build American AI, affiliée au super PAC Leading the Future, recrute systématiquement des influenceurs sur les réseaux sociaux via l’agence marketing SM4 afin de diffuser le message « La Chine menace l’IA américaine » sur TikTok et Instagram. L’organisation
GateNewsIl y a 27m
Nebius achète Eigen AI pour $643M afin de stimuler le déploiement des modèles d’IA
D’après The Economic Times, le 1er mai, la société d’infrastructure d’IA basée à Amsterdam Nebius a annoncé son intention d’acquérir Eigen AI pour environ 643 millions de dollars en espèces et en actions de catégorie A. Eigen AI, fondée par d’anciens chercheurs du MIT, se spécialise dans les technologies d’inférence et d’optimisation. Nebius prévoit de poursuivre…
GateNewsIl y a 31m
Le Pentagone signe des accords d'IA avec 8 entreprises, exclut Anthropic de l'accès au réseau Secret-Level
Selon Beating News, le Pentagone a annoncé des accords avec huit entreprises technologiques pour déployer leurs outils et infrastructures d’IA sur des réseaux militaires américains classifiés au niveau secret (IL6) et top secret (IL7). Les entreprises nouvellement signataires incluent Nvidia, Microsoft, AWS, Reflection AI, ainsi que précédemment
GateNewsIl y a 31m