Google lance des puces TPU de 8e génération améliorant le ratio performance-prix, sépare l’entraînement et l’inférence

2026-04-22 12:12:00

Message Gate News, 22 avril — Google Cloud a annoncé la sortie de ses puces TPU (Tensor Processing Unit) sur mesure de 8e génération, le 22 avril. La nouvelle gamme comprend TPU 8t, conçu spécifiquement pour les tâches d’entraînement à l’IA, et TPU 8i, optimisé pour les charges de travail d’inférence IA. Les deux puces seront disponibles plus tard cette année. Google a également dévoilé de nouveaux outils pour construire des agents d’IA et annoncé un fonds $750 million pour accélérer l’adoption de l’IA en entreprise.

TPU 8t offre 2,8 fois les performances de l’ancienne TPU Ironwood de génération précédente de Google au même niveau de prix. TPU 8i améliore les performances de 80% par rapport à son prédécesseur et intègre une architecture de mémoire vive statique à accès aléatoire (SRAM) pour fournir « un débit à grande échelle rentable et une faible latence, permettant à des millions d’agents de fonctionner simultanément », selon le PDG Sundar Pichai. Par rapport à Ironwood, les TPU 8t et TPU 8i atteignent toutes deux plus du double de l’efficacité performance-par-watt, avec une amélioration de 124% pour TPU 8t et de 117% pour TPU 8i. Google a optimisé l’efficacité énergétique sur l’ensemble de la pile technologique et intégré des systèmes de gestion dynamique de l’alimentation qui ajustent la consommation selon la demande en temps réel.

Les modèles first-party de Google traitent désormais plus de 160 milliards de tokens par minute via des appels directs à l’API client, contre 100 milliards le trimestre dernier. L’IA génère désormais 75% de tout le nouveau code chez Google, contre 50% à l’automne de l’année dernière. Gemini Enterprise, l’offre entreprise de Google, a progressé de 40% d’un trimestre sur l’autre en utilisateurs actifs mensuels payants. L’entreprise s’attend à investir légèrement plus de la moitié de son budget de calcul pour l’apprentissage automatique dans des services cloud d’ici 2026 afin de mieux servir les clients cloud et les partenaires. Google étend aussi sa collaboration avec Broadcom pour développer et fournir des puces TPU sur mesure pour les générations futures, alors que de grandes entreprises technologiques recherchent des alternatives aux GPU coûteux et contraints en approvisionnement de NVIDIA et AMD.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

04-22 04:51

Snowflake étend ses produits d’IA grâce à de nouveaux connecteurs et outils pour développeurs

04-22 02:41

Google consolide ses outils de codage par IA sous la plateforme Antigravity

04-22 01:21

OpenAI étend ses partenariats avec Accenture et TCS pour déployer Codex auprès de clients professionnels

04-21 23:49

OpenAI déploie ChatGPT Images 2.0 avec des capacités de « thinking »

04-21 14:52

La liste Forbes AI 50 met en avant 20 nouvelles entreprises ; OpenAI et Anthropic captent 80 % du financement total

Analyse approfondie

Tencent QClaw ouvre une phase de test à l’étranger, 700 dollars US en jetons pour le Japon pour entrer en avance

Market Whisper04-21 05:28

Google cherche à développer l’écosystème de puces d’IA avec Marvell, alors que la concurrence avec Nvidia s’intensifie

Cryptonews04-21 04:17

Amazon renforce encore Anthropic à hauteur de 25 milliards de dollars : 5 GW de capacité informatique, et un engagement de 100 milliards de dollars sur AWS

ChainNewsAbmedia04-21 00:35

Commentaire

0/400

Aucun commentaire