Xiaomi раскрывает подробности обучения MiMo-V2-Pro: 1T параметров модели, тысячи развернутых GPU

Сообщение Gate News, 24 апреля — руководитель команды большой языковой модели Xiaomi Луо Фули в подробном интервью раскрыла, что модель MiMo-V2-Pro в сумме имеет 1 триллион параметров и для обучения потребовала тысячи GPU. Она отметила, что масштаб 1T представляет собой минимальный порог для достижения производительности, приближающейся к уровню Claude Opus 4.6, и получения конкурентного входного билета на следующий этап ИИ-агентов.

Технически версия Pro использует механизм экстремально разреженного внимания с соотношением 7:1 между глобальным вниманием и вниманием в скользящем окне, чтобы контролировать затраты на инференс при обработке длинного контекста. Модель также сохраняет архитектуру MTP (Multi-Token Prediction), чтобы задействовать избыточную вычислительную мощность для более быстрого инференса.

Со стороны управления команда MiMo численностью 100 человек имеет лишь 30–40 сотрудников, непосредственно вовлеченных в ключевые итерации. Команда работает без формальных иерархий или явных делений на подгруппы и без фиксированных дедлайнов поставки. При столкновении с нестабильными численными проблемами, такими как всплески training loss, команда в первую очередь приостанавливает обучение для расследования, даже если это означает остановку работы на одну-две недели и понесение затрат в миллионы долларов на вычисления.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

OpenClaw выпускает v2026.5.2 с миграцией плагинов с npm на ClawHub, более 200 исправлений ошибок

По данным Beating, open-source персональный ИИ-ассистент OpenClaw выпустил v2026.5.2 3 мая — крупное обновление технического обслуживания. Основное изменение заключается в миграции системы плагинов с npm на самописную дистрибуционную платформу ClawHub. Обновление включает более 200 исправлений ошибок и добавляет t

GateNews12м назад

Член совета Федеральной резервной системы Боуман: регуляторам необходимо продумать, как реагировать на новые технологии вроде Anthropic Mythos

PANews, 2 мая: член Совета управляющих ФРС Боуман заявил, что регулирующим органам необходимо продумать, как наилучшим образом регулировать такие новые технологии, как Mythos от Anthropic. «С одной стороны, эти возможности позволяют компаниям устранять уязвимости, которые они выявляют сами, тем самым повышая кибербезопасность», — сказал Боуман. «Но с другой стороны, если технология будет использована злоумышленниками, ее можно будет применять для выявления и эксплуатации слабых мест». Anthropic, оценивая меры защиты от этой мощной новой технологии, уже ограничила выпуск своего последнего ИИ-модели. Этот же фактор побудил официальных лиц администрации Трампа начать рассматривать вероятность кибератак, которые могут создать угрозу финансовой стабильности.

GateNews40м назад

Ханчжоуский суд запретил увольнения только за счёт ИИ и поддержал работника после 40% снижения зарплаты 28 апреля

По данным Bloomberg, 28 апреля Ханчжоуский промежуточный народный суд вынес решение о том, что работодатели не могут увольнять работников или сокращать им зарплату только потому, что ИИ автоматизировал их должности. Суд поддержал выплату компенсации работнику, чья зарплата была сокращена на 40%, а также его уволили после отказа от перевода на другую должность, когда ИИ

GateNews50м назад

Последний судебный прецедент китайского суда: законные основания для сокращений персонала из‑за ИИ-автоматизации отсутствуют

Согласно последнему решению суда Ханчжоу, компании увольняют, понижают в должности или существенно уменьшают зарплату под предлогом внедрения таких технологий, как ИИ, и это является незаконным; простого технологического прогресса недостаточно, чтобы приравнять это к предусмотренному законом сокращению штата. В этом деле сотрудника понизили в должности из-за автоматизации и его зарплата сократилась до 40%. Суд в итоге поддержал выплату компенсации, что показывает: при продвижении автоматизации нужно действовать в рамках закона и обеспечивать профессиональную трансформацию и переподготовку.

ChainNewsAbmedia1ч назад

Хоскинсон обсуждает роль Midnight в экосистеме Cardano в выпуске The Breakdown

Чарльз Хоскинсон, основатель Cardano и сооснователь Ethereum, появился в качестве гостя в выпуске 701 подкаста «The Breakdown», который ведёт Дэвид Гокхштейн, чтобы обсудить проект Midnight, проблемы с пользовательским опытом в криптовалюте и его видение будущего блокчейна. Во время интервью Хоскинсон

CryptoFrontier8ч назад

Berkshire Energy видит возможность роста из-за спроса на электроэнергию, обусловленного ИИ-driven спросом

Согласно Beating, на собрании акционеров Berkshire генеральный директор Абель подчеркнул, что спрос на электроэнергию, формируемый с помощью ИИ, создает новые возможности роста для энергетического бизнеса компании: половина ее энергетических коммунальных предприятий уже обеспечивает электропитание, связанное с требованиями ИИ. В Айове дата-центры теперь составляют…

GateNews11ч назад
комментарий
0/400
Нет комментариев