De acordo com Beating, a MiniMax publicou seu relatório técnico M2 na arXiv, detalhando sua arquitetura MoE (mixture-of-experts) principal e o sistema de treinamento de Agentes Forge. A empresa revelou como o Forge otimiza o reforço do aprendizado por agentes em contextos longos por meio de técnicas de agendamento FIFO em janelas e mesclagem de árvore de prefixos, alcançando até 40x de aceleração no treinamento.
A M2.7 demonstrou capacidades de autoevolução autônoma de agentes, concluindo mais de 100 ciclos de análise, revisão de código e testes. Em benchmarks de desempenho, a M2.7 atingiu 56,22% no SWE-Pro e 52,7% no Multi-SWE-bench, com uma taxa média de recompensa de 66,6% no MLE Bench, aproximando níveis de desempenho do Gemini 3.1.