Yuntianliyifei présente une architecture mémoire empilée 3D dans le développement de puces d’inférence

D’après les divulgations de la direction investisseurs du 12 mai, la puce d’inférence de Yuntianliyifei en développement adopte une architecture GPNPU comme feuille de route technologique principale. Les points techniques clés incluent une capacité de programmation universelle de niveau GPGPU compatible avec les écosystèmes CUDA grand public, des cœurs NPU optimisés pour l’efficacité de l’inférence, et une architecture de mémoire empilée en 3D conçue pour augmenter la bande passante et réduire la latence d’accès, afin de franchir le goulot d’étranglement du « memory wall ».

L’entreprise emploie aussi une architecture modulaire de calcul pour prendre en charge la construction de supernœuds à l’échelle du rack avec montée en puissance, pour des inférences de modèles MoE à des échelles de l’ordre du billion et du hundred-trillion. La feuille de route technologique vise à réduire de manière exponentielle les coûts par jeton et à accélérer le déploiement d’applications de grands modèles.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Les introductions en bourse de Cerebras cette semaine à une valorisation de 55 milliards de dollars, offrant à OpenAI une participation potentielle de 11%

D’après Odaily, le fabricant de puces d’intelligence artificielle Cerebras va entrer en bourse cette semaine avec une valorisation de 55 milliards de dollars lors d’une introduction en bourse (IPO). L’engagement d’investissement de 200 milliards de dollars d’OpenAI pourrait lui donner une participation de 11% dans l’entreprise.

GateNewsIl y a 6m

Cerebras entre en bourse cette semaine à une valorisation de 5,5 milliards de dollars ; la participation de 11 % d’OpenAI pourrait rapporter plus de 5 milliards de dollars

D’après The Information, le fabricant de puces d’IA Cerebras va entrer en Bourse cette semaine avec une valorisation de 5,5 milliards de dollars lors de son introduction en Bourse (IPO). L’engagement d’investissement de 20 milliards de dollars d’OpenAI pourrait lui conférer une participation de 11% dans la société, ce qui pourrait générer plus de 5 milliards de dollars de produit.

GateNewsIl y a 7m

SAP investit dans n8n, doublant la valorisation de la plateforme d’automatisation des workflows à 5,2 milliards de dollars

Selon Bloomberg, SAP a investi dans n8n mardi, doublant la valorisation de la plateforme d'automatisation des workflows à 5,2 milliards de dollars. Le géant allemand du logiciel a également signé un accord de partenariat pluriannuel avec n8n afin d'intégrer les outils de la plateforme dans la plateforme de création d'agents d'IA Joule Studio de SAP, d'après la déclaration de SAP.

GateNewsIl y a 24m

La startup d’IA White Circle finalise une levée de fonds de démarrage $11M avec OpenAI et des dirigeants d’Anthropic

Selon Odaily, la start-up d'IA White Circle a récemment achevé une levée de fonds seed de 11 millions de dollars, avec la participation notamment de Romain Huet, cadre d'OpenAI, et de Durk Kingma, chercheur chez Anthropic. L'entreprise propose une API unifiée pour le suivi en temps réel des entrées et des sorties des grands modèles de langage, conçue pour détecter les hallucinations, les attaques par injection d'instructions, les contenus préjudiciables, les dérives du modèle et le comportement

GateNewsIl y a 37m

Artificial Analysis publie un benchmark d’agent de codage ; Zhipu GLM-5.1 arrive en première place parmi les modèles open-source

Artificial Analysis a publié aujourd’hui un nouvel indice d’agent de codage pour évaluer les performances des modèles d’IA lorsqu’ils sont combinés à des frameworks d’agents sur des benchmarks clés, dont SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 et SWE-Atlas-QnA. Zhipu GLM-5.1 arrive en première position parmi les modèles open source dans cette évaluation, démontrant des performances de premier plan dans des scénarios d’agents de codage en conditions réelles.

GateNewsIl y a 40m

La plateforme B.AI ajoute 8 756 utilisateurs le 11 mai, DeepSeek-V4 alimente 60 % de la consommation de jetons

D'après B.AI, la plateforme a ajouté 8 756 nouveaux utilisateurs le 11 mai, tandis que l’adoption des paiements Stripe parmi les utilisateurs payants principaux a atteint 69,0 %, reflétant une meilleure rétention des développeurs traditionnels et des utilisateurs de niveau production. Les modèles de la série DeepSeek-V4 représentaient près de 60 % de la consommation de tokens, s’appuyant sur des capacités de latence ultra-faible, de concurrence élevée et de débit pour servir de moteur d’exécutio

GateNewsIl y a 1h
Commentaire
0/400
Aucun commentaire