MiniMax lança relatório técnico M2; o sistema Forge atinge aumento de 40x na velocidade de treinamento

De acordo com Beating, a MiniMax publicou seu relatório técnico M2 na arXiv, detalhando sua arquitetura MoE (mixture-of-experts) principal e o sistema de treinamento de Agentes Forge. A empresa revelou como o Forge otimiza o reforço do aprendizado por agentes em contextos longos por meio de técnicas de agendamento FIFO em janelas e mesclagem de árvore de prefixos, alcançando até 40x de aceleração no treinamento.

A M2.7 demonstrou capacidades de autoevolução autônoma de agentes, concluindo mais de 100 ciclos de análise, revisão de código e testes. Em benchmarks de desempenho, a M2.7 atingiu 56,22% no SWE-Pro e 52,7% no Multi-SWE-bench, com uma taxa média de recompensa de 66,6% no MLE Bench, aproximando níveis de desempenho do Gemini 3.1.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários