Message de Gate News, 25 avril — Une pénurie de GPU refait surface alors que de grands fournisseurs de cloud, dont Microsoft et Amazon, concentrent la capacité de calcul au profit de leurs équipes internes et de leurs principaux clients comme OpenAI et Anthropic, laissant les plus petites start-ups d’IA faire face à des hausses de prix, à des délais d’attente prolongés et à des conditions contractuelles plus strictes. La direction commerciale d’Azure chez Microsoft a informé les équipes que les délais d’attente des GPU pour les clients cloud devraient persister jusqu’à la fin 2026.
La start-up de génération d’images Krea, qui a levé $83 million auprès d’investisseurs dont Andreessen Horowitz et Bain Capital Ventures, louait auparavant des centaines de puces Blackwell à 2,80 $ de l’heure dans le cadre d’un contrat de six mois. Lors du renouvellement, plusieurs fournisseurs de cloud ont cessé de répondre aux demandes ; Krea a finalement obtenu des puces à 3,70 $ de l’heure, soit une hausse de 32 %, avec un contrat prolongé d’un an. Le PDG Victor Perez a noté que certains vendeurs ne répondaient simplement pas, tandis que d’autres exigeaient des engagements pluriannuels avant de négocier. Le PDG du fournisseur de cloud GPU Lightning AI, Will Falcon, a révélé que la société fait tourner 40 000 GPU en ligne, mais qu’environ 40 clients en file d’attente nécessitent un total de 400 000 GPU, les prix de location augmentant de plus de 25 % en l’espace de six mois.
Microsoft a mis en place une gestion de l’accès aux GPU par paliers : environ 1 000 des plus grands clients (Tier 1) reçoivent une allocation prioritaire, tandis que les clients plus modestes qui cherchent des puces Blackwell doivent s’engager sur au moins 1 000 unités pour une durée minimale d’un an, avec des contrats commençant à plusieurs dizaines de millions de dollars. Les clients en paiement à l’usage risquent de perdre l’accès aux GPU si les appareils restent inactifs pendant plusieurs heures. Les start-ups participant au programme free-tier de Microsoft for Startups ont également été prévenues qu’une utilisation insuffisante des GPU pourrait entraîner la révocation de l’accès.
La société de capital-risque General Catalyst interroge ses sociétés en portefeuille sur les goulots d’étranglement liés au calcul et explore des pools de GPU partagés ou des stratégies de négociation collective. Certaines start-ups envisagent l’achat direct de GPU pour contourner les files d’attente : la start-up d’IA pour l’industrie pétrolière Collide prévoit de dépenser environ 500 000 $ en GPU Nvidia, en louant des espaces de data center pour fonctionner de manière indépendante et éviter l’incertitude.
Articles similaires
JPMorgan et Mastercard terminent le règlement transfrontalier « pour la première fois » via la tokenisation des bons du Trésor américain à partir d’un grand livre XRP
HawkEye 360 lève $416M lors de son introduction en bourse au NYSE, valorisée à 2,42 milliards de dollars
L’Allemagne envisage de supprimer l’exonération fiscale de la détention de Bitcoin pendant un an et d’adopter un régime d’imposition similaire à celui des actions
Les ETF Bitcoin au comptant enregistrent 45,85 millions de dollars d’entrées nettes sur une nuit, BlackRock IBIT en tête avec 134 millions de dollars
Les commandes du T1 de DoorDash manquent les estimations malgré les dépenses technologiques
La Corée du Sud dépasse le Canada et devient le septième plus grand marché boursier mondial, en hausse de 71% depuis le début de l’année, à 4,59 billions de dollars