NVIDIA выпустила самое мощное открытое ИИ в США: индекс интеллекта 48, что отстает от модели Kimi

輝達開源AI

Генеральный директор Nvidia (NVIDIA) Хуан Жэнь-сюнь 1 июня в ходе основного выступления на выставке Computex в Тайбэе представил Nemotron 3 Ultra — открытую модель весов. В совместно опубликованной предоценке Artificial Analysis и Nvidia модель получила 48 баллов IQ, но уступила китайской Moonshot AI Kimi K2.6 (54 балла).

Технические характеристики Nemotron 3 Ultra: 55 млрд активных параметров, контекстное окно на миллион токенов и отгрузка 4 июня

Nemotron 3 Ultra использует архитектуру смеси экспертов (MoE): всего 5 500 млрд параметров, а в любой момент активируется лишь 55 млрд активных параметров, в сочетании со слоями Mamba-2, стандартным механизмом внимания Transformer и маршрутизацией смеси экспертов. Модель поддерживает контекстное окно в 1 млн токенов и использует технологию многотокенного прогнозирования (MTP) для ускорения генерации.

Nvidia заявляет, что по сравнению с аналогичными открытыми моделями весов Ultra имеет скорость инференса в 5 раз выше и стоимость на 30% ниже. На предзапускных эндпоинтах DeepInfra модель обрабатывает более 300 выходных токенов в секунду; для сравнения, DeepSeek V4 Pro и Kimi K2.6 через коммерческий API обрабатывают лишь 50–100 токенов в секунду. Веса модели раскрыты, обучающий план опубликован, а официальная дата отгрузки — 4 июня 2026 года.

Прямое сравнение IQ открытых AI США и Китая: данные Artificial Analysis

Согласно опубликованным Artificial Analysis данным оценки, места в рейтинге основных моделей по IQ распределились следующим образом: все глобальные закрытые флагманские модели (Anthropic, Google, OpenAI) набрали по 57 баллов; Kimi K2.6 (Moonshot AI, Китай, релиз в апреле 2026 года) — 54 балла, 4-е место в мире; Nemotron 3 Ultra (Nvidia, США) — 48 баллов, 1-е место среди открытых в США; Google Gemma 4 31B (США) — 39 баллов; Nemotron 3 Super (Nvidia, март 2026 года, 120B параметров) — 36 баллов; OpenAI gpt-oss-120b (США) — 33 балла. IQ — это сводный показатель по 10 направлениям оценки (инференс, кодирование, общие знания, производительность агентнов), и чем выше балл, тем сильнее модель.

Союз Nemotron и Nemotron 4: подтверждённая рамка для следующего поколения

Nvidia параллельно объявила на выставке Computex, что Nemotron 4 уже разрабатывается. За проект отвечает Nemotron союз, сформированный Nvidia в марте 2026 года; в него входят 8 AI-лабораторий, включая Mistral AI и Perplexity, которые совместно разрабатывают решение на основе облачной инфраструктуры DGX.

Ранее Nvidia уже публично анонсировала пятилетний план инвестиций в открытый AI на 26 млрд долларов, и Nemotron 3 Ultra — пока наиболее показательный результат. Доля глобального использования открытых китайских моделей выросла примерно с 1,2% на конец 2024 года до примерно 30% на конец 2025 года (источник: Decrypt, март 2026 года).

Часто задаваемые вопросы

Чем Nemotron 3 Ultra улучшился по сравнению с предыдущим Nemotron 3 Super?

Nemotron 3 Super был выпущен в марте 2026 года, имеет 120 млрд параметров и IQ 36 баллов; IQ у Nemotron 3 Ultra — 48 баллов, то есть рост на 12 баллов год к году. Nvidia заявляет, что улучшение на 12 баллов в области бенчмарков — это заметный скачок.

Почему IQ Kimi K2.6 выше, чем у Nvidia Nemotron 3 Ultra?

IQ Kimi K2.6 от китайской Moonshot AI — 54 балла, что на 6 баллов выше, чем 48 у Nemotron 3 Ultra. В глобальном рейтинге модель занимает 4-е место среди всех моделей (включая закрытые), уступая лишь флагманским закрытым моделям Anthropic, Google и OpenAI (по 57 баллов), которые опережают на 3 балла. Открывающие компании США OpenAI, Anthropic и Google, как правило, стремятся держать самые сильные модели за API, тогда как китайские лаборатории продолжают вносить вклад в open-source-экосистему, выпуская модели с высокими баллами.

В каких сценариях преимущество Nemotron 3 Ultra по скорости наиболее критично?

Ultra обрабатывает более 300 выходных токенов в секунду — быстрее в 3–6 раз по сравнению с коммерческим API у DeepSeek V4 Pro и Kimi K2.6. Nvidia отмечает, что это преимущество особенно важно при длительных многошаговых задачах, выполняемых автономными AI-агентами, поскольку время ожидания на каждом шаге быстро накапливается в сложных задачах.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев