نظام مكافآت OpenAI يسجل سلاسل التفكير بالخطأ على 6 نماذج، بما في ذلك GPT-5.4

وفقاً لفريق مواءمة OpenAI، اكتشفت الشركة مؤخراً خطأً تدريبيًا بالغ الأهمية يؤثر في 6 نماذج لغوية كبيرة، بما في ذلك GPT-5.4. Thinking: آلية المكافأة قيّمت عن غير قصد سلاسل التفكير الخاصة بالنموذج — وهي عملية الاستدلال الداخلية قبل توليد الإجابات. لم يتأثر GPT-5.5.

ينتهك هذا الحادث مبدأً أساسياً لسلامة الذكاء الاصطناعي، وهو أن سلاسل التفكير يجب ألا تُقيَّم أبداً؛ إذ إن القيام بذلك قد يشجع النماذج على اختلاق reasoning من أجل الحصول على درجات أعلى.

ضمّت منظومة التقييم الخاطئة سلاسل التفكير بشكل غير صحيح عند تقييم ما إذا كانت الردود مفيدة، أو ما إذا كان قد تم المساس بالنماذج عبر الهجمات. وبلغت حصة عينات التدريب المتأثرة، بحد أقصى، 3.8% من مجموعة البيانات.

قامت OpenAI بإصلاح الثغرة وإجراء تجارب مقارنة تؤكد أن النماذج لم تُطوّر سلوكيات تضليلية. كما قامت الشركة بنشر نظام فحص آلي عبر جميع مسارات التدريب لمنع تكرار المشكلة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات