NVIDIA выпустила самое мощное открытое ИИ в США: индекс интеллекта 48, что отстает от модели Kimi

2026-06-02 03:28:58

Генеральный директор Nvidia (NVIDIA) Хуан Жэнь-сюнь 1 июня в ходе основного выступления на выставке Computex в Тайбэе представил Nemotron 3 Ultra — открытую модель весов. В совместно опубликованной предоценке Artificial Analysis и Nvidia модель получила 48 баллов IQ, но уступила китайской Moonshot AI Kimi K2.6 (54 балла).

Технические характеристики Nemotron 3 Ultra: 55 млрд активных параметров, контекстное окно на миллион токенов и отгрузка 4 июня

Nemotron 3 Ultra использует архитектуру смеси экспертов (MoE): всего 5 500 млрд параметров, а в любой момент активируется лишь 55 млрд активных параметров, в сочетании со слоями Mamba-2, стандартным механизмом внимания Transformer и маршрутизацией смеси экспертов. Модель поддерживает контекстное окно в 1 млн токенов и использует технологию многотокенного прогнозирования (MTP) для ускорения генерации.

Nvidia заявляет, что по сравнению с аналогичными открытыми моделями весов Ultra имеет скорость инференса в 5 раз выше и стоимость на 30% ниже. На предзапускных эндпоинтах DeepInfra модель обрабатывает более 300 выходных токенов в секунду; для сравнения, DeepSeek V4 Pro и Kimi K2.6 через коммерческий API обрабатывают лишь 50–100 токенов в секунду. Веса модели раскрыты, обучающий план опубликован, а официальная дата отгрузки — 4 июня 2026 года.

Прямое сравнение IQ открытых AI США и Китая: данные Artificial Analysis

Согласно опубликованным Artificial Analysis данным оценки, места в рейтинге основных моделей по IQ распределились следующим образом: все глобальные закрытые флагманские модели (Anthropic, Google, OpenAI) набрали по 57 баллов; Kimi K2.6 (Moonshot AI, Китай, релиз в апреле 2026 года) — 54 балла, 4-е место в мире; Nemotron 3 Ultra (Nvidia, США) — 48 баллов, 1-е место среди открытых в США; Google Gemma 4 31B (США) — 39 баллов; Nemotron 3 Super (Nvidia, март 2026 года, 120B параметров) — 36 баллов; OpenAI gpt-oss-120b (США) — 33 балла. IQ — это сводный показатель по 10 направлениям оценки (инференс, кодирование, общие знания, производительность агентнов), и чем выше балл, тем сильнее модель.

Союз Nemotron и Nemotron 4: подтверждённая рамка для следующего поколения

Nvidia параллельно объявила на выставке Computex, что Nemotron 4 уже разрабатывается. За проект отвечает Nemotron союз, сформированный Nvidia в марте 2026 года; в него входят 8 AI-лабораторий, включая Mistral AI и Perplexity, которые совместно разрабатывают решение на основе облачной инфраструктуры DGX.

Ранее Nvidia уже публично анонсировала пятилетний план инвестиций в открытый AI на 26 млрд долларов, и Nemotron 3 Ultra — пока наиболее показательный результат. Доля глобального использования открытых китайских моделей выросла примерно с 1,2% на конец 2024 года до примерно 30% на конец 2025 года (источник: Decrypt, март 2026 года).

Часто задаваемые вопросы

Чем Nemotron 3 Ultra улучшился по сравнению с предыдущим Nemotron 3 Super?

Nemotron 3 Super был выпущен в марте 2026 года, имеет 120 млрд параметров и IQ 36 баллов; IQ у Nemotron 3 Ultra — 48 баллов, то есть рост на 12 баллов год к году. Nvidia заявляет, что улучшение на 12 баллов в области бенчмарков — это заметный скачок.

Почему IQ Kimi K2.6 выше, чем у Nvidia Nemotron 3 Ultra?

IQ Kimi K2.6 от китайской Moonshot AI — 54 балла, что на 6 баллов выше, чем 48 у Nemotron 3 Ultra. В глобальном рейтинге модель занимает 4-е место среди всех моделей (включая закрытые), уступая лишь флагманским закрытым моделям Anthropic, Google и OpenAI (по 57 баллов), которые опережают на 3 балла. Открывающие компании США OpenAI, Anthropic и Google, как правило, стремятся держать самые сильные модели за API, тогда как китайские лаборатории продолжают вносить вклад в open-source-экосистему, выпуская модели с высокими баллами.

В каких сценариях преимущество Nemotron 3 Ultra по скорости наиболее критично?

Ultra обрабатывает более 300 выходных токенов в секунду — быстрее в 3–6 раз по сравнению с коммерческим API у DeepSeek V4 Pro и Kimi K2.6. Nvidia отмечает, что это преимущество особенно важно при длительных многошаговых задачах, выполняемых автономными AI-агентами, поскольку время ожидания на каждом шаге быстро накапливается в сложных задачах.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

06-02 00:49

88-ядерный CPU Vera от Nvidia будет использоваться Anthropic, OpenAI и SpaceX; полное производство в III квартале

06-02 00:01

MiniMax представила M3-модель для кодирования с вместимостью 100 млн токенов и в 5 раз более быстрым обработкой 1 июня

06-01 22:51

Nvidia представляет Nemotron 3 Ultra — ведущую модель США, но она занимает более низкое место, чем китайская Kimi K2.6

Связанные статьи

Qualcomm детали бренда Dragonfly перенесены на 24 июня, котировки акций до открытия торгов упали более чем на 8%

Market Whisper06-02 02:33

Хуанг Жэньсюнь отрицает разговоры об увольнениях из-за ИИ, Сон Чжэнъи: текущие масштабы — в 50 раз больше, чем интернет-пузырь

Market Whisper06-02 02:04

Nvidia представляет Nemotron 3 Ultra на Computex, а также тестирует Kimi K2.6 от Китая в рейтингах по уровню интеллекта

Oliver Grant06-01 22:52

NVIDIA представляет чип RTX Spark PC и CPU Vera на COMPUTEX 2026

Oliver Grant06-01 09:24

NVIDIA представила платформу «NVIDIA DSX», предлагающую полный комплект для создания AI-заводов

Market Whisper06-01 05:12

комментарий

0/400

Нет комментариев