OpenAI и Broadcom представляют Jalapeño — первый пользовательский ИИ-чип для LLM Inference

OpenAI и Broadcom сегодня представили Jalapeño — первый процессор для интеллекта (Intelligence Processor) OpenAI, предназначенный для инференса больших языковых моделей. Чип был вручен генеральному директору OpenAI Сэму Альтману и президенту Грегу Брокману президентом и генеральным директором Broadcom Хок Таном и президентом Чарли Каввасом. Этот ускоритель — первый AI-чип в рамках многопоколенческой вычислительной платформы, которую компании создают совместно, чтобы сделать продвинутый ИИ быстрее, надежнее и доступнее. OpenAI спроектировала чип с нуля на основе своего понимания основ LLM, а Broadcom и Celestica помогли промышленно внедрить платформу через реализацию чипа, интеграцию плат и стоек, высокопроизводительный сетевой обмен и масштабируемые производственные системы.

OpenAI и Broadcom передают чип Jalapeño руководству компании

Передача чипа знаменует важный шаг в стратегии OpenAI по созданию полного стека для своих моделей и продуктов. Jalapeño был разработан в сотрудничестве между OpenAI, Broadcom и Celestica, где каждый партнер внес свой специализированный опыт в платформу.

OpenAI спроектировала архитектуру чипа, исходя из своего плана развития моделей, ядер, систем обслуживания и потребностей продуктов. Broadcom внесла реализацию чипа и сетевые технологии, включая кремний Tomahawk, чтобы довести платформу до крупномасштабного производства. Celestica предоставила экспертизу в области интеграции плат и стоек, а также масштабируемых производственных систем.

Архитектура Jalapeño оптимизирована для рабочих нагрузок инференса LLM

Jalapeño спроектирован с гибкостью для работы со всеми LLM на основе понимания OpenAI потребностей в инференсе текущих и будущих моделей ИИ по всей отрасли. Инженерные образцы уже выполняют рабочие нагрузки машинного обучения в лаборатории на целевой частоте и энергопотреблении, включая GPT-5.3-Codex-Spark.

Ранние испытания показывают, что Jalapeño обеспечит производительность на ватт, существенно превосходящую текущие лучшие показатели. Архитектура сокращает перемещение данных и балансирует вычислительные, память и сетевые ресурсы, достигая реализованной утилизации, близкой к теоретической пиковой производительности. Подробный технический отчет будет представлен в ближайшие месяцы.

«Jalapeño был спроектирован с нуля для инференса LLM, используя детальные знания, полученные в тесном сотрудничестве с исследователями OpenAI», — сказал Ричард Хо, который руководит аппаратной программой OpenAI. «Мы оптимизировали архитектуру вокруг ядер, перемещения памяти, сети и шаблонов обслуживания, которые наиболее важны для передовых моделей ИИ. Основываясь на ранних испытаниях, Jalapeño будет эффективно выполнять наши наиболее важные рабочие нагрузки вблизи теоретических пределов оборудования».

Чип представляет собой дизайн «с чистого листа» для современного инференса LLM, а не универсальный ускоритель, адаптированный из более ранних рабочих нагрузок ИИ. Он основан на системах, которые OpenAI ежедневно эксплуатирует для ChatGPT, Codex, API и будущих агентных продуктов. Цель — сочетать мощность и пропускную способность современных ведущих AI-ускорителей с задержкой, близкой к самым быстрым специализированным системам инференса.

Разработка завершена за девять месяцев с использованием AI-ассистированного дизайна

Jalapeño был совместно разработан от начального дизайна до производственного tape-out всего за девять месяцев. Компании считают, что это самый быстрый цикл разработки ASIC, когда-либо достигнутый в высокопроизводительных передовых полупроводниках.

Ускоренный график отражает глубокую совместную разработку программного и аппаратного обеспечения с инженерными группами OpenAI, опыт Broadcom в реализации кремния и использование моделей OpenAI для ускорения частей процесса проектирования и оптимизации. Те же модели, которые используются пользователями, помогают улучшать инфраструктуру для запуска будущих моделей.

Запланирована многопоколенческая вычислительная платформа с Broadcom и Celestica

Jalapeño — первый шаг в многопоколенческой вычислительной платформе, объединяющей ускорители, спроектированные OpenAI, с реализацией кремния, сетевыми и соединительными технологиями Broadcom, а также экспертизой Celestica в области плат, стоек и систем.

«Мир движется к экономике, основанной на вычислениях», — сказал Грег Брокман, президент и сооснователь OpenAI. «Jalapeño — часть нашей долгосрочной стратегии инфраструктуры полного стека, направленной на то, чтобы сделать вычисления более доступными, в результате чего ИИ станет быстрее, надежнее, дешевле для людей и бизнеса, и сможет использоваться для решения более важных проблем. Проектируя большую часть стека самостоятельно, мы можем предоставлять больше интеллекта с большей эффективностью и продолжать продвигать передовой ИИ к более широкому доступу».

Развертывание запланировано на конец 2026 года

Многопоколенческая вычислительная платформа предназначена для первоначального развертывания к концу 2026 года с последующим расширением. OpenAI работает на всех уровнях стека, включая архитектуру чипа, ядра, системы памяти, сетевые взаимодействия, планирование, системы развертывания и пользовательский опыт, где каждый уровень оптимизирован для того, чтобы сделать модели быстрее, надежнее и доступнее для пользователей.

FAQ

Что такое Jalapeño и когда он был представлен?

Jalapeño — первый процессор для интеллекта (Intelligence Processor) OpenAI, AI-ускоритель, специально разработанный для инференса больших языковых моделей. OpenAI и Broadcom представили чип сегодня.

Сколько времени заняла разработка Jalapeño?

Jalapeño был совместно разработан от начального дизайна до производственного tape-out за девять месяцев. Компании считают, что это самый быстрый цикл разработки ASIC, когда-либо достигнутый в высокопроизводительных передовых полупроводниках.

Когда будет развернут Jalapeño?

Многопоколенческая вычислительная платформа с Jalapeño предназначена для первоначального развертывания к концу 2026 года, с расширением в последующие годы.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев