Google lance des puces TPU de 8e génération améliorant le ratio performance-prix, sépare l’entraînement et l’inférence

Message Gate News, 22 avril — Google Cloud a annoncé la sortie de ses puces TPU (Tensor Processing Unit) sur mesure de 8e génération, le 22 avril. La nouvelle gamme comprend TPU 8t, conçu spécifiquement pour les tâches d’entraînement à l’IA, et TPU 8i, optimisé pour les charges de travail d’inférence IA. Les deux puces seront disponibles plus tard cette année. Google a également dévoilé de nouveaux outils pour construire des agents d’IA et annoncé un fonds $750 million pour accélérer l’adoption de l’IA en entreprise.

TPU 8t offre 2,8 fois les performances de l’ancienne TPU Ironwood de génération précédente de Google au même niveau de prix. TPU 8i améliore les performances de 80% par rapport à son prédécesseur et intègre une architecture de mémoire vive statique à accès aléatoire (SRAM) pour fournir « un débit à grande échelle rentable et une faible latence, permettant à des millions d’agents de fonctionner simultanément », selon le PDG Sundar Pichai. Par rapport à Ironwood, les TPU 8t et TPU 8i atteignent toutes deux plus du double de l’efficacité performance-par-watt, avec une amélioration de 124% pour TPU 8t et de 117% pour TPU 8i. Google a optimisé l’efficacité énergétique sur l’ensemble de la pile technologique et intégré des systèmes de gestion dynamique de l’alimentation qui ajustent la consommation selon la demande en temps réel.

Les modèles first-party de Google traitent désormais plus de 160 milliards de tokens par minute via des appels directs à l’API client, contre 100 milliards le trimestre dernier. L’IA génère désormais 75% de tout le nouveau code chez Google, contre 50% à l’automne de l’année dernière. Gemini Enterprise, l’offre entreprise de Google, a progressé de 40% d’un trimestre sur l’autre en utilisateurs actifs mensuels payants. L’entreprise s’attend à investir légèrement plus de la moitié de son budget de calcul pour l’apprentissage automatique dans des services cloud d’ici 2026 afin de mieux servir les clients cloud et les partenaires. Google étend aussi sa collaboration avec Broadcom pour développer et fournir des puces TPU sur mesure pour les générations futures, alors que de grandes entreprises technologiques recherchent des alternatives aux GPU coûteux et contraints en approvisionnement de NVIDIA et AMD.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Anthropic s’associe avec BlackRock et Goldman Sachs pour lancer une coentreprise de conseil en IA avec un investissement de 1,5 milliard de dollars

D’après le WSJ, Anthropic finaliserait un accord visant à lancer, lundi, une coentreprise avec BlackRock, Goldman Sachs et d’autres entreprises de Wall Street, dans le but de vendre des outils d’intelligence artificielle à des sociétés soutenues par du capital-investissement. La coentreprise devrait servir de division de conseil pour Anthropic,

GateNewsIl y a 5m

La Chine bloque l’acquisition de l’IA Manus US$2B de Meta

La Chine a annoncé qu’elle bloquait l’acquisition de 2 milliards de dollars de Meta de la société d’agents d’IA Manus, invoquant des inquiétudes concernant le transfert de la propriété intellectuelle chinoise en matière d’intelligence artificielle à une entreprise américaine, d’après les informations de Tech in Asia. Manus, une entreprise fondée en Chine qui a déplacé son siège social vers

CryptoFrontierIl y a 23m

Tencent a utilisé le code de Claude d’Anthropic dans la dernière formation du modèle Hy3, indique The Information

Selon The Information, en citant des mémo internes de Tencent et des sources, des employés de Tencent ont utilisé Claude Code d’Anthropic pendant la phase de post-formation de Hy3, le dernier grand modèle de langage de l’entreprise, malgré l’interdiction explicite d’Anthropic des services commerciaux aux entreprises chinoises invoquant des raisons nationales

GateNewsIl y a 54m

Samsung Electro-Mechanics en hausse sur la demande liée à l’IA, KB Securities relève le prix cible le 4 mai

D’après KB Securities, le 4 mai, Samsung Electro-Mechanics a maintenu une recommandation d’achat et relevé son objectif de cours, citant une forte demande de condensateurs céramiques multicouches et de substrats FC-BGA utilisés dans les serveurs d’IA. La société a fait état d’un chiffre d’affaires sur le premier trimestre de 3,2 billions de wons (2,18 milliards de dollars) et

GateNewsIl y a 1h

Meta améliore l’engagement sur Facebook et Instagram au T1 de l’exercice 2026 ; le temps passé sur Reels augmente de 10 %

Selon The Economic Times, les résultats du 1er trimestre de l’exercice 2026 de Meta ont montré que des mises à niveau liées à l’IA ont stimulé l’engagement vidéo sur Facebook et Instagram. Le temps passé sur Instagram Reels a augmenté de 10%, tandis que le temps de visionnage des vidéos Facebook a progressé de plus de 8% dans le monde. Le prix moyen par annonce a augmenté de 12% d’une année sur l’autre, et de plus de 8

GateNewsIl y a 1h

Nouvelle étude de la faculté de médecine de Harvard : l’IA améliore les décisions diagnostiques aux urgences par rapport aux médecins humains

Une étude publiée par la Harvard Medical School dans la revue Science compare objectivement les différences entre les systèmes d’IA et les médecins humains dans l’interprétation des dossiers médicaux, en s’appuyant sur des tests en double aveugle et sur une évaluation par raisonnement clinique. Les résultats montrent que, aux points de décision précoces aux urgences, l’IA peut être équivalente ou supérieure à celle des médecins traitants, et ce en se fondant uniquement sur les informations disponibles à ce moment-là dans les dossiers électroniques. L’étude souligne également que l’IA ne peut pas encore exercer la médecine de manière autonome, et que les médecins restent indispensables ; en cas d’adoption à grande échelle, l’IA pourrait réduire les erreurs de diagnostic et les coûts liés à la consultation.

ChainNewsAbmediaIl y a 1h
Commentaire
0/400
Aucun commentaire