По данным Beating, MiniMax опубликовала свой технический отчёт M2 на arXiv, в котором подробно описала флагманскую архитектуру MoE (mixture-of-experts) и систему обучения агентов Forge. Компания раскрыла, как Forge оптимизирует обучение с подкреплением для агентов с длинным контекстом за счёт оконного FIFO-планирования и техник слияния по префиксному дереву, добиваясь до 40-кратного ускорения обучения.
M2.7 продемонстрировала возможности автономной самоэволюции агентa: она завершила более 100 раундов циклов анализа, пересмотра кода и тестирования. На тестовых бенчмарках M2.7 показала 56,22% на SWE-Pro и 52,7% на Multi-SWE-bench, а также среднюю частоту вознаграждений 66,6% на MLE Bench, приблизившись к уровню производительности Gemini 3.1.