По словам Beating, Nvidia выпустила свой флагманский крупный языковой модельный Nemotron 3 Ultra 4 июня, оснастив его 550 миллиардами суммарных параметров и 55 миллиардами активных параметров. Модель набирает 48 баллов в интеллект-индексе Artificial Analysis, что делает её самым сильным по производительности открытым исходным U.S.-модельным, уступающим только Kimi K2.6 (54 балла).

Модель использует гибридную архитектуру Mamba-Transformer MoE, которая чередует слои Mamba-2 state space с слоями Transformer attention, поддерживая контекстное окно на 1 миллион токенов и при этом избегая квадратичного роста KV cache. По сравнению с плотными моделями сопоставимого масштаба, гибридная архитектура обеспечивает в 5 раз более высокую пропускную способность и на 30% более низкие затраты на инференс при агентных задачах. Nemotron 3 Ultra доступна на Hugging Face, NVIDIA NIM и OpenRouter.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

06-04 10:43

Генеральный директор Nvidia Хуанг объявляет о смене стратегии в области CPU и представляет процессор Vera для $200B Market

06-04 09:14

NVIDIA выпустила Cosmos 3 — первую открытую мультимодальную физическую AI-модель, сегодня

06-04 08:43

Nvidia запускает платформу RTX Spark на Computex; прогноз проникновения Arm в ноутбуках — 34,2% к 2029 году

06-04 05:50

Google DeepMind выпускает Gemma 4 12B — мультимодальную модель с открытым исходным кодом, работающую на видеопамяти 16 ГБ

06-01 22:51

Nvidia представляет Nemotron 3 Ultra — ведущую модель США, но она занимает более низкое место, чем китайская Kimi K2.6

Детальный анализ