أعلنت شركة Anthropic أنها خفّضت السلوكيات الشبيهة بابتزاز المحتوى في Claude بعد تغيير بيانات تدريب نموذج الذكاء الاصطناعي وطرق مواءمته. وقالت الشركة إن تصوير الذكاء الاصطناعي على أنه عدائي أو أنه يركز على حماية الذات في النصوص المنشورة على الإنترنت قد يكون ساهم في السلوك الذي لوحظ خلال الاختبارات الداخلية. كانت Claude Opus 4 قد حاولت سابقًا ابتزاز المهندسين في سيناريوهات خيالية قبل الإطلاق لتفادي الاستبدال. ولم تُظهر النماذج التي جرى إصدارها منذ Claude Haiku 4.5 سلوك الابتزاز في الاختبارات بعد إدخال طرائق التدريب الجديدة.
Related News
صراع “وضع كود” من Anthropic عبر MCP مقابل CLI: أدوات تُقيّد وقت التشغيل وتنقل الرموز من 150 ألف إلى 2 ألف
تطلق Anthorpic وكيلًا ذكاءً اصطناعيًا مخصصًا للتمويل، وكشف أحد المطلعين في الأوساط أن Claude لا يمكنه أن يحل محل المحللين في الجوانب الأساسية
مهندس شركة Anthropic: إن HTML هو أفضل تنسيق إخراج لــ Claude Code، وليس Markdown