Стоимость GPU Nvidia Blackwell удваивается, но расходы на инференс (обработку одного токена) снижаются в 35 раз по сравнению с Hopper

Согласно последнему анализу блога Nvidia, стоимость GPU Blackwell почти вдвое выше за час по сравнению с поколением Hopper, но при этом они обеспечивают в 35 раз более низкие затраты на инференс в пересчёте на токен. В качестве тестовой модели используется DeepSeek-R1: Blackwell (GB300 NVL72) сдается в аренду по $2,65 за GPU в час против $1,41 для Hopper, однако пропускная способность одного GPU растет с 90 до 6 000 токенов в секунду. Этот 65-кратный прирост пропускной способности снижает затраты на миллион токенов с $4,20 до $0,12.

Показатель $0,12 предполагает полную оптимизацию ПО, включая инференс с низкой точностью FP4 и предсказание нескольких токенов (MTP). Если MTP не включена, затраты на миллион токенов достигают примерно $2,35, но при активной MTP они падают до $0,11, демонстрируя 21-кратное влияние оптимизации только от этой функции.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Сэм Альтман и Дарио Амодей слишком раздражают! Апокалиптические прогнозы об ИИ и чувство относительной обделённости заставляют американцев испытывать неприязнь к ИИ

В известном подкасте Силиконовой долины《All-In Podcast》при обсуждении индустрии ИИ прозвучало довольно резкое наблюдение: отношение американского общества к ИИ переходит в негативную сторону, и эта волна эмоций находит самое конкретное выражение в том, что в качестве главной мишени выступают дата-центры, которые ИИ-компании сейчас в срочном порядке строят по всей территории США. Источником такого неприятия могут быть как ИИ-апокалиптические настроения, страх безработицы, так и более глубокое недовольство: новая волна технологических инноваций, похоже, снова приведёт к обогащению лишь немногих, тогда как жизнь большинства людей не станет заметно лучше. В США местные органы власти уже отменяют решения о строительстве дата-центров Chamath Palihapitiya в эфире заявил, что проблемы, с которыми сейчас сталкивается ИИ-индустрия, связаны не только с конкуренцией моделей, капитальными затратами или нехваткой вычислительных мощностей, а с тем, что «американцы в целом всё больше и больше испытывают отвращение к этой теме — ИИ». Он отметил, что источником такого отвращения могут быть, в том числе, ИИ

ChainNewsAbmedia12м назад

Вопросы сообщества об идеологической предвзятости в основных моделях ИИ 4 мая

По данным BlockBeats, 4 мая пользователь X Freeze из сообщества, посвящённого ИИ, задал вопрос, демонстрируют ли мейнстримные ИИ-модели, включая ChatGPT, Claude и Gemini, систематическую предвзятость, будучи менее согласованными с консервативными позициями по таким темам, как пол, иммиграция и преступность. Пользователь предположил, что как ИИ

GateNews2ч назад

Cerebras планирует IPO$4B на Nasdaq, начнет роуд-шоу 4 мая по цене $115–$125 за акцию

Как сообщает Reuters, компания по производству ИИ-чипов Cerebras Systems начала роуд-шоу IPO 4 мая в рамках листинга на Nasdaq под тикером CBRS. Компания планирует установить цену акций в диапазоне от 115 до 125 долларов США и может привлечь до US$4 billion при оценке примерно в 40 миллиардов долларов США. Это стало для Cerebras вторым

GateNews2ч назад

ИИ: В США рост ВВП в I квартале на 75%, а в 2027 крупнейшие 5 компаний по капитальным затратам могут превысить 1,1 триллиона долларов

Morgan Stanley вновь пересмотрел вверх прогноз по капитальным затратам для пяти крупнейших облачных компаний США: в 2026 году — около 8 050 миллиардов долларов, в 2027 году — около 1,116 триллиона долларов, при этом в 2026 году расходы на неконтикентовые компании будут сопоставимы с 2025 годом. Дэвид Сакс заявил, что вклад AI capex в ВВП составляет около 2,5%, а в следующем году может превысить 3%; это рассматривается как новый двигатель экономики США.

ChainNewsAbmedia2ч назад

Чтобы успеть на волну IPO SpaceX, OpenAI и Anthropic, NASDAQ и S&P смягчают требования

The Wall Street Journal сообщила, что в преддверии IPO SpaceX, OpenAI, Anthropic и др. S&P 500 и Nasdaq ослабили критерии включения акций в состав. S&P 500 снизила период наблюдения за новыми бумагами до 6 месяцев или предоставляет освобождение от порога по прибыли; Nasdaq 100 запустил быстрый приём, и для сверхкрупных IPO они могут попасть в индекс уже на 15-й день после листинга. При отборе теперь упор делается на общую рыночную капитализацию, отменяется требование минимального объёма free-float, и применяется динамическое взвешивание. Эксперты сомневаются, что это может усилить риски «горячих» акций и исказить ценообразование, если рыночное раскрытие цены будет недостаточным.

ChainNewsAbmedia2ч назад

ASX предостерегает компании не преувеличивать влияние ИИ на 4 мая

По данным Bloomberg, 4 мая оператор фондовой биржи Австралии ASX предупредил компании не преувеличивать влияние искусственного интеллекта на свои бизнесы. Главный специалист по комплаенсу ASX Лусинда Макканн заявила, что биржа отслеживает «раскачку» или заявления, предназначенные для повышения котировок акций

GateNews3ч назад
комментарий
0/400
Нет комментариев