كاشف Cursor عن طريقة التدريب "التمهيد الذاتي": استخدام Composer القديم لإنشاء بيئة لنموذج جديد، وارتفاع أداء Terminal-Bench بمقدار 14 نقطة

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، كشفت Cursor عن تقنية تدريب لسلسلة نماذج Composer: استخدام النموذج السابق لبناء بيئة تشغيل تلقائيًا لتعزيز التعلم (RL) للجيل التالي. عند تدريب Composer 2، استخدمت Cursor Composer 1.5 لإنجاز هذه المهمة، وأطلقت عليها اسم autoinstall.

يتطلب تدريب RL بيئة برمجية قابلة للتشغيل. إذا لم تكن البيئة معدة بشكل جيد، فإن النموذج يضيع الرموز في تصحيح الأخطاء، ولا يتعلم شيئًا؛ وفي الحالات القصوى، قد تتعطل البيئة تمامًا، وتُهدر قوة الحوسبة على التدريب بأكمله. يحل autoinstall هذه المشكلة على خطوتين: الخطوة الأولى، يقرأ وكيل (agent) وثائق ومواصفات قاعدة البيانات، ويقترح 10 أوامر للتحقق ونتائج متوقعة؛ الخطوة الثانية، يأخذ وكيل آخر 3 أوامر من بين تلك، ويبدأ من الصفر في إعداد البيئة حتى يتم تشغيل الأوامر بنجاح. وتُكرر الخطوة الثانية حتى 5 مرات، وإذا فشلت جميعها، يتم التخلي عن تلك البيئة.

خلال عملية إعداد البيئة، يقوم الوكيل بشكل نشط بتكميل الاعتمادات المفقودة: إنشاء جداول قاعدة البيانات الوهمية، إعداد تكوين MinIO كبديل لـ S3، تشغيل حاويات Docker لتعمل كخدمات جانب، وحتى توليد صور مؤقتة. في منشور مدونة، تم استخدام مشروع blockchain الخاص بـ celo-org/celo-monorepo كمثال لعرض العملية الكاملة، حيث قام الوكيل بعد فشل إعداد البيئة في الجولة الأولى، بإنشاء مستخدم وهمي لتجاوز التحقق، وتمكن في النهاية من تشغيل الاختبار.

حقق Composer 2 درجة 61.7% في اختبار Terminal-Bench (مقياس يقيم قدرة النموذج على بناء بيئة التطوير)، متفوقًا بنسبة تقارب 14 نقطة مئوية على Composer 1.5 الذي حصل على 47.9%. وأكدت Cursor أن الخطط المستقبلية تتضمن مشاركة النسخة القديمة من Composer في مزيد من مراحل التدريب، بما في ذلك المعالجة المسبقة للبيانات، وإدارة التشغيل، وتحسين الهيكلية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت