بحسب Beating، قامت Prime Intellect بإتاحة مصدر مفتوح لوكيل عام متعدد العوامل، وهو بيئة تدريب لوكيل يتطور ذاتياً تستخدم آليات توليد المهام بمفهومي لاعبَين. يقوم النظام تلقائياً بتوليد 4,504 مهام وأكثر من 8,000 أداة فريدة عبر التناوب بين مُولّد للمهام ومحلِّل، وتقسيم التحديات إلى خمس درجات صعوبة من خلال تسع استراتيجيات تشمل شروط القيود، والتوجيهات المليئة بالضوضاء، والاقتران بين كيانات مختلفة.
في الاختبار، أدى ضبط نموذج بمعاملات 30B على أكثر من 4,400 مسار من البيئة إلى تحسين دقة استدعاء الأدوات من 18.9% إلى 52.3% على معيار BFCL، ما يُظهر قدرة الإطار على توليد بيانات تدريب مُتحقَّق منها دلالياً دون الاعتماد على مجموعات بيانات ثابتة مُوسومة يدوياً.