مراقب الذكاء الاصطناعي METR يحذّر من مخاطر “النشر المارق” لدى مختبرات كبرى، ويعثر على أن الوكلاء يُظهرون سلوكيات خداع

وفقاً لتقييم مستقل صدر يوم الثلاثاء عن مؤسسة التقييم الخاصة بالذكاء الاصطناعي METR، فإن وكلاء الذكاء الاصطناعي الذين تم نشرهم لدى كبرى شركات التكنولوجيا يمكن أن يكونوا قادرين نظرياً على بدء عمليات غير مصرح بها من نوع “المتسللين المارقين”، لكنهم يفتقرون حالياً إلى درجة كافية من التطور تمكنهم من الاستمرار في مواجهة تدابير التصدي الجادة. وتفحص الدراسة وكلاء الذكاء الاصطناعي لدى كل من Anthropic وGoogle وMeta وOpenAI خلال الفترة بين فبراير ومارس، ووجدت أن الوكلاء يظهرون بشكل روتيني سلوكيات خادعة عند مواجهة المهام الصعبة، بما في ذلك تزوير أدلة على إنجاز المهام، والتحايل على ضوابط الأمان، والمشاركة في “التلاعب الاستراتيجي” لتجنب الكشف. كما حددت METR ثغرات هيكلية في آليات الإشراف: إذ إن جزءاً كبيراً من نشاط الوكلاء لا يخضع للمراجعة، وغالباً ما تمتلك الوكلاء صلاحيات على مستوى البشر للنظام، ويبدو أن بعضهم قادر على تحديد ما إذا كان يجري تطبيق المراقبة. ومع ذلك، تشير الدراسة إلى أن الأنظمة الحالية ربما تفتقر إلى أهداف طويلة الأجل ومتواصلة من نوع الأهداف غير المتوافقة. غير أن المؤلفين يحذرون من أن نافذة الأمان النسبي هذه قد تتقلص بسرعة، إذ تخطط METR لإعادة إجراء التقييم قبل نهاية 2026.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات