Сообщение Gate News, 25 апреля — Дефицит GPU вновь обостряется: крупные облачные провайдеры, включая Microsoft и Amazon, концентрируют вычислительные мощности для внутренних команд и ключевых клиентов вроде OpenAI и Anthropic, из-за чего небольшие AI-стартапы сталкиваются с ростом цен, увеличенными сроками ожидания и более жесткими условиями контрактов. Операционный менеджмент Microsoft Azure сообщил сотрудникам, что время ожидания GPU для облачных клиентов, как ожидается, сохранится до конца 2026 года.
Стартап по генерации изображений Krea, который привлек $83 миллиона от инвесторов, включая Andreessen Horowitz и Bain Capital Ventures, ранее арендовал сотни чипов Blackwell по $2.80 в час по шестимесячному контракту. После продления несколько облачных провайдеров перестали отвечать на запросы; в итоге Krea получила чипы по $3.70 в час — это рост на 32%, а контракт был продлен до одного года. Генеральный директор Виктор Перес отметил, что некоторые вендоры просто не отвечали, тогда как другие настаивали на многолетних обязательствах перед переговорами. Генеральный директор провайдера облачных GPU Lightning AI Уилл Фалькон сообщил, что компания держит в онлайне 40,000 GPU, но примерно 40 клиентов в очереди требуют в сумме 400,000 GPU, при этом арендные цены растут более чем на 25% в течение шести месяцев.
Microsoft внедрила многоуровневое управление доступом к GPU: примерно 1,000 крупнейших клиентов (Tier 1) получают приоритетное распределение, в то время как более мелкие клиенты, которым нужны чипы Blackwell, должны законтрактовать как минимум 1,000 единиц минимум на один год, а контракты начинаются с десятков миллионов долларов. Клиенты с оплатой по факту использования рискуют потерять доступ к GPU, если устройства простаивают в течение нескольких часов. Стартапам, участвующим в бесплатной программе Microsoft for Startups, также сообщили, что при недостаточном использовании GPU доступ может быть отозван.
Фирма венчурного капитала General Catalyst проводит опрос своих портфельных компаний по вопросам узких мест в вычислениях и изучает варианты общих пулов GPU или стратегии коллективных переговоров. Некоторые стартапы рассматривают прямые покупки GPU, чтобы обойти очереди: AI-стартап для нефтяной отрасли Collide планирует потратить около $500,000 на GPU Nvidia, арендовав мощности дата-центра, чтобы работать независимо и избежать неопределенности.
Связанные статьи
JPMorgan и Mastercard завершили «первое» кроссбордерное расчётное урегулирование токенизированными казначейскими облигациями США на основе XRP-реестра
HawkEye 360 привлекает $416M в ходе IPO на NYSE, оценка — 2,42 миллиарда долларов
Германия планирует отменить налоговые льготы на хранение BTC сроком на один год и перейти к налоговой модели для акций
Спотовые ETF на Bitcoin за одну ночь привлекли $45,85 млн чистого притока; BlackRock IBIT лидирует на $134 млн
Заказы DoorDash в 1-м квартале не дотянули до прогнозов на фоне сокращения расходов на технологии
Южная Корея обогнала Канаду и стала седьмым по величине фондовым рынком в мире: рост на 71% с начала года до $4,59 трлн