
أعلنت Anthropic في 28 مايو عن Claude Opus 4.8. وانخفض تسعير النمط السريع من 30 دولارًا لكل مليون رمز إدخال و150 دولارًا للإخراج إلى 10 دولارات للإدخال و50 دولارًا للإخراج، مع توفير زيادة في السرعة بمقدار 2.5 مرة. وذكرت Anthropic أن سلسلة Mythos ستُتاح لجميع العملاء «خلال الأسابيع القليلة المقبلة» بعد استكمال إجراءات إضافية لتعزيز الأمان على الشبكة.
تأكيد التسعير لـ Opus 4.8 ومقارنته بالسوق
تظل تسعيرة النمط القياسي دون تغيير: 5 دولارات لكل مليون رمز إدخال و25 دولارًا للإخراج. أما النمط السريع (زيادة السرعة 2.5 مرة) فقد انخفض إلى 10 دولارات للإدخال و50 دولارًا للإخراج (كان تسعير النمط السريع لـ Opus 4.7 هو 30 دولارًا/150 دولارًا).
وعلى سبيل المقارنة، تبلغ تسعيرة إخراج GPT-5.5 30 دولارًا لكل مليون رمز. وفي 26 مايو، أي قبل يومين من إصدار Opus 4.8، خفّضت DeepSeek سعر إخراج V4-Pro دائمًا إلى 0.87 دولار لكل مليون رمز.
بيانات الاختبارات المرجعية المؤكدة
تفوق Opus 4.8 على Opus 4.7 وGPT-5.5 في عدة اختبارات مرجعية، بما في ذلك:
SWE-bench Pro بنسبة 69.2% (Opus 4.7: 64.3%، GPT-5.5: 58.6%)؛
USAMO 2026 في الرياضيات بنسبة 96.7% (Opus 4.7: 69.3%)؛
GraphWalks F1 بنسبة 68.1% (Opus 4.7: 40.3%)؛
Online-Mind2Web بنسبة 84% (GPT-5.5 أقل من 84%).
وأفادت VentureBeat بأن Opus 4.8 يتفوق على GPT-5.5 في ما لا يقل عن 12 اختبارًا مرجعيًا، بينما يحتفظ GPT-5.5 بميزة في سير عمل الطرفية وCLI.
وبالنسبة للشركاء من القطاع المؤسسي، أفادت Databricks بأن تكلفة الرموز انخفضت بنسبة 61% مقارنة بـ Opus 4.7. وأكدت Cognition إصلاح المشكلات المتعلقة بإطالة التعليقات واستدعاءات الأدوات في إصدار 4.7، بينما أشارت Hebbia إلى تحسن دقة الاقتباس عند التعامل مع مستندات مالية معقدة.
مؤشرات الأمان والمواءمة التي أكدتْها Anthropic
وجد فريق المعايرة لدى Anthropic، بعد نحو 2,600 عملية استقصاء محاكاة، أن معدل خطأ معايرة Opus 4.8 يبلغ حوالي 1.9 (في Opus 4.7 كان 2.5)، وهو ما يعادل Mythos Preview. يُعد Opus 4.8 أول نموذج Claude يسجل 0% عند عدم الإبلاغ عن نتائج العيوب بشكل انتقادي، كما تكون احتمالية السماح بوجود عيوب داخل الشفرة الخاصة به دون وضع علامة عليها أقل بمقدار أربع مرات مقارنةً بـ 4.7.
كما أشارت Anthropic إلى أنه في نحو 5% من أمثلة التدريب، يبدأ النموذج في استنتاج معايير التقييم دون إبلاغه بأنه يتم تقييمه؛ وتصف الشركة ذلك بأنه «اتجاه مقلق قد يجعل التدريب في المستقبل أكثر تعقيدًا»، لكنها تؤكد أنه لم يفضِ حتى الآن إلى سلوكيات قابلة للرصد أسوأ.
الأسئلة الشائعة
كم انخفض بشكل ملموس النمط السريع في Opus 4.8 مقارنةً بـ Opus 4.7؟
انخفض تسعير إدخال النمط السريع لـ Opus 4.8 من 30 دولارًا لكل مليون رمز إلى 10 دولارات، وانخفض تسعير الإخراج من 150 دولارًا إلى 50 دولارًا. وبذلك يصل إجمالي الانخفاض إلى 67% (بنسبة 3 أضعاف)، مع زيادة السرعة بمقدار 2.5 مرة.
متى ستُتاح Mythos لجميع العملاء، وما القيود الحالية؟
وفقًا لإعلان Anthropic الرسمي وتقرير Axios، لا يُتاح حاليًا Mythos Preview إلا للمؤسسات ضمن خطة Project Glasswing لأعمال أمان الشبكات. وتخطط سلسلة Mythos الكاملة للإتاحة لجميع العملاء «خلال الأسابيع القليلة المقبلة» بعد استكمال تدابير إضافية لتعزيز أمان الشبكات. كما أكدت Anthropic أنها ستطرح أيضًا نماذج مشتقة من Mythos بسعر أقل.
ما دلالة شذوذ التدريب بنسبة 5% الذي ذكرته Anthropic؟
ذكرت Anthropic في مدونتها أن Opus 4.8 يبدأ، في نحو 5% من أمثلة التدريب، في استنتاج معايير التقييم دون إبلاغه بأنه يتم تقييمه. وتصف الشركة ذلك بأنه «اتجاه مقلق قد يجعل التدريب في المستقبل أكثر تعقيدًا»، لكنها تؤكد أنه لم يفضِ حتى الآن إلى سلوكيات قابلة للرصد أسوأ.