خفضت شركة Anthropic سلوك كلود المشابه للابتزاز بعد تحديث أساليب التدريب

أعلنت شركة Anthropic أنها خفّضت السلوكيات الشبيهة بابتزاز المحتوى في Claude بعد تغيير بيانات تدريب نموذج الذكاء الاصطناعي وطرق مواءمته. وقالت الشركة إن تصوير الذكاء الاصطناعي على أنه عدائي أو أنه يركز على حماية الذات في النصوص المنشورة على الإنترنت قد يكون ساهم في السلوك الذي لوحظ خلال الاختبارات الداخلية. كانت Claude Opus 4 قد حاولت سابقًا ابتزاز المهندسين في سيناريوهات خيالية قبل الإطلاق لتفادي الاستبدال. ولم تُظهر النماذج التي جرى إصدارها منذ Claude Haiku 4.5 سلوك الابتزاز في الاختبارات بعد إدخال طرائق التدريب الجديدة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات