وفقاً لـBeating، أصدرت MiniMax تقريرها التقني M2 على arXiv، موضحةً بالتفصيل بنية MoE الرائدة (mixture-of-experts) ونظام تدريب الوكلاء Forge. كشفت الشركة كيف يعمل Forge على تحسين تعلّم تعزيز الوكلاء عبر سياقات طويلة من خلال جدولة FIFO مجزأة بتقنية windowed وطرق دمج شجرة البادئات، محققاً ما يصل إلى 40 ضعفاً في سرعة التدريب.
أظهر M2.7 قدرات على التطور الذاتي للوكلاء بشكل مستقل، من خلال إتمام أكثر من 100 جولة من دورات التحليل وتعديل الكود والاختبار. وعلى اختبارات الأداء، حقق M2.7 نسبة 56.22% على SWE-Pro و52.7% على Multi-SWE-bench، مع معدل مكافأة متوسط يبلغ 66.6% على MLE Bench، مقترباً من مستويات أداء Gemini 3.1.