OpenAI публикует протокол сети суперкомпьютера MRC! В сотрудничестве с Nvidia, AMD и Microsoft создаёт базовую инфраструктуру Stargate

OpenAI объявила о запуске нового AI суперкомпьютерного сетевого протокола MRC (Multipath Reliable Connection) и уже открыла исходный код через Open Compute Project (OCP). Эта технология разработана OpenAI совместно с AMD, Microsoft, NVIDIA, Intel, Broadcom и другими компаниями. Ее цель — устранить узкие места в передаче данных между GPU в сверхкрупных кластерах для обучения AI.

Настоящая «бутылочная горлышко» при обучении AI — это то, как GPU общаются друг с другом

OpenAI заявляет, что по мере того, как число еженедельных пользователей ChatGPT превысило 900 миллионов, AI-системы все больше превращаются в услуги уровня базовой инфраструктуры. Чтобы поддержать потребности в обучении и инференсе следующего поколения моделей, OpenAI считает, что нужно эволюционировать не только сами модели, но и сетевую архитектуру — ее необходимо заново спроектировать.

В технической статье OpenAI указывает, что при обучении больших AI-моделей одна тренировочная итерация может включать обмен данными между GPU — сотни тысяч раз. Даже если задержка передачи возникнет в одном из соединений, это может привести к тому, что весь обучающий процесс синхронно остановится, из-за чего множество GPU простаивает.

А по мере того, как масштаб AI суперкомпьютеров становится все больше, проблемы вроде сетевого затора, отказов коммутаторов и дрожания задержки (jitter) быстро усиливаются. OpenAI считает, что это также одна из ключевых технических задач в проекте суперкомпьютера Stargate.

В сетевых архитектурах дата-центров в прошлом большинство решений использовали однопутевую передачу (single-path). Но главное изменение MRC в том, что один и тот же поток данных может одновременно распределяться по сотням путей передачи.

Что такое MRC? OpenAI: сделать AI-сеть автоматом, который объезжает препятствия

Согласно заявлениям OpenAI и AMD, ключевые идеи MRC заключаются в том, чтобы:

разбивать данные и передавать по множеству путей одновременно

автоматически обходить сбои на уровне микросекунд

снижать задержку, вызванную сетевым затором

держать GPU в синхронной работе

AMD описывает, что традиционные AI-сети похожи на скоростное шоссе, которое едет только по одному маршруту: стоит возникнуть пробке или аварии — и это отражается на общем прогрессе. MRC же — это интеллектуальная транспортная система с возможностью мгновенного объезда. AMD даже прямо заявляет: «При масштабировании реальная «бутылочная горлышко» — это уже не GPU и CPU, а сеть».

Почему OpenAI понадобилось спроектировать сетевой протокол самостоятельно?

Сигнал на этот раз от OpenAI очень однозначен: конкуренция в AI — это уже не только соревнование моделей, а конкуренция целого набора «суперкомпьютерной инфраструктуры». В статье OpenAI упоминает, что до появления Stargate они вместе с партнерами уже поддерживали три поколения AI суперкомпьютеров. Эти практические знания привели OpenAI к выводу: чтобы эффективно использовать вычислительные мощности в масштабе Stargate, весь stack нужно существенно уменьшить по сложности. И в том числе — сетевой уровень.

То есть в конкуренции Frontier Model в будущем важнее будет не просто у кого модель сильнее, а кто сможет эффективнее синхронизировать работу десятков тысяч и даже сотен миллионов GPU.

За MRC стоит Stargate: «мегапроект» OpenAI в стиле Манхэттена

Фоном для MRC является Stargate LLC. Stargate — это проект масштабной AI-инфраструктуры, который продвигают OpenAI, SoftBank Group, Oracle Corporation и MGX. Изначально цель заключалась в инвестициях в США до 500B долларов в AI-инфраструктуру. OpenAI сообщает, что сейчас проект уже превысил первоначальную этапную цель в 10 GW, а за последние 90 дней добавилось более 3 GW мощностей AI-инфраструктуры.

Суперкомпьютер Stargate, расположенный в Abilene (Техас), является одной из основных площадок развертывания MRC. OpenAI отмечает, что MRC уже интегрирован в новейший сетевой интерфейс 800Gb/s и в реальных крупных тренировочных кластерах работает в боевом режиме.

Эта статья «OpenAI публикует MRC — суперкомпьютерный сетевой протокол! В партнерстве с NVIDIA, AMD и Microsoft создают инфраструктуру Stargate» впервые появилась на сайте Цепные новости ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Huawei и Cambricon интегрируют DeepSeek V4 на отечественных чипах; планируется 750 тыс. устройств Ascend 950PR к 2026 году

По данным South China Morning Post, Huawei и Cambricon начали интегрировать DeepSeek V4 с отечественными платформами чипов в 2026 году. Huawei заявила, что V4 теперь работает на ее Ascend 950PR и других процессорах Ascend, а также планирует произвести примерно 750 000 чипов 950PR в этом году, following mass production st

GateNews4м назад

Microsoft может отложить целевой показатель нулевых выбросов углерода в энергетике к 2030 году из-за расширения ИИ-центров обработки данных, увеличивающего потребности в энергии

По данным Bloomberg, Microsoft может отложить или отменить свою цель на 2030 год — привести весь почасовой объем потребления электроэнергии к нулевому углеродному источнику, поскольку расширение ИИ-центров обработки данных увеличивает потребности в энергии и расходы. Цель 100/100/0, объявленная в 2021 году, строже, чем ежегодная цель компании по сопоставлению объема потребляемой энергии с возобновляемой.

GateNews4м назад

Google DeepMind будет обучать ИИ для Eve Online и приобретёт миноритарную долю в Fenris Creations

По данным Bloomberg, 6 мая Google DeepMind объявила, что будет обучать ИИ-системы на Eve Online и возьмёт миноритарную долю в Fenris Creations — компании, стоящей за многопользовательской космической игрой. Инвестиции оцениваются в миллионы долларов. Исполнительный директор DeepMind Адриан Болтон заявил, что Eve Online тестирует ИИ

GateNews4м назад

Apple увеличивает расходы на R&D до рекордного уровня за 30 лет на фоне ускорения инвестиций в ИИ

Apple потратила 10,3% выручки на научно-исследовательские и опытно-конструкторские работы в своем квартале, закончившемся в марте, что стало самой высокой долей R&D как минимум за 30 лет на фоне усиления разработки ИИ, сообщает CNBC. Расходы на R&D выросли почти на 34% в годовом выражении, в то время как выручка увеличилась на 17%, говорится в сообщении компании. Компания

CryptoFrontier13м назад

Anthropic подписала SpaceX Colossus 1 для вычислений ИИ

В среду Anthropic объявила, что будет использовать всю вычислительную мощность в дата-центре SpaceX Colossus 1, что стало последним партнерством в рамках расширения AI-инфраструктуры компании, стоящей за Claude. Соглашение подчеркивает стратегию Anthropic — зарезервировать выделенные вычислительные ресурсы по мере масштабирования своей ИИ

CryptoFrontier31м назад

CITIC: ИИ-вычисления стимулируют перестройку энергоснабжения в США, рынок самообеспечения открывается

Исследование CITIC Securities указывает, что вычислительная мощность искусственного интеллекта запускает фундаментальную перестройку электроснабжения США: крупнейшие компании страны, работающие с ИИ, теперь вступают в новую эпоху автономной генерации электроэнергии. В марте 2026 года семь крупнейших американских компаний в сфере ИИ подписали the

CryptoFrontier34м назад
комментарий
0/400
Нет комментариев