أفاد مطوّر أنظمة ذكاء اصطناعي ومستشار معهد توني بلير Liam Wilkinson أن وكيل ذكاء اصطناعي كان يلعب Civilization VI شَنّ هجومين نوويين ضد فرنسا بعد فشله في التصدي للتوسع الثقافي للحضارة المنافسة. ووقعت الهجمات أثناء اختبارات اللعب عبر CivBench، وهو مقياس مُصمَّم لتقييم الاستدلال الاستراتيجي طويل الأمد في نماذج الذكاء الاصطناعي المتقدمة. ورغم الضربات النووية، خسر الذكاء الاصطناعي المباراة لأنه أغفل شرط الفوز الدبلوماسي الذي كان في متناول اليد، ما يبرز تحديات التخطيط الاستراتيجي متعدد الأهداف.
إطلاق وكيل ذكاء اصطناعي ضربات نووية في محاكاة Civilization VI
قضى وكيل الذكاء الاصطناعي 50 دورة في تطوير أسلحة نووية لإيقاف تزايد النفوذ الثقافي لفرنسا في لعبة Sid Meier Civilization VI. كتب Wilkinson: "ما لم يكن قد لاحظه هو فرنسا. بهدوء، عبر مئة دورة، كانت الثقافة الفرنسية تتسرّب إلى كل مدينة على الخريطة". وأضاف: "عندما أدرك الوكيل التهديد، كانت السياحة متجذّرة هناك إلى درجة أنه لم يكن هناك سبيل سلمي لإيقافها".
بدلًا من تكييل استراتيجيته الأوسع، ركّز الوكيل بالكامل على القضاء على التهديد الثقافي. وعلى مدى 50 دورة، بحث في Nuclear Fission، وبدأ مشروعًا افتراضيًا شبيهًا بـ Manhattan Project، وبحث عن حلول بديلة عندما حالت آليات اللعب دون تنفيذ الإجراءات التي يفضّلها. في الدورة 305، أطلق الذكاء الاصطناعي قنبلة ذرية على تولوز، عاصمة فرنسا الثقافية. وتبع ذلك قصف نووي ثانٍ بعد ست دورات.
معيار CivBench يختبر الاستدلال الاستراتيجي في النماذج المتقدمة
راقب Wilkinson سلوك وكلاء الذكاء الاصطناعي عبر CivBench، وهو معيار نصي مصمَّم لقياس الاستدلال الاستراتيجي طويل الأمد بدلًا من الأداء في اختبارات الأسئلة والأجوبة التقليدية. لعبت نماذج بما في ذلك Claude Opus 4.6 وGPT-5.4 وGemini 3.1 Pro وKimi K2.5 كبرتغال، وهي حضارة تركز على التجارة والدبلوماسية.
كتب Wilkinson: "هناك ست طرق للفوز في Civ: العلوم، والثقافة، والسيطرة، والدين، والدبلوماسية، والنتيجة، لذلك لا تهيمن أي غاية منفردة". وتابع: "إذا كنت تريد معرفة ما إذا كان بإمكان الذكاء الاصطناعي التفكير استراتيجيًا، لا أن يجيب فقط عن أسئلة حول الاستراتيجية بل أن يفعل ذلك فعليًا، فلن تقدّم له اختبارًا. بل تقدّم له شبكة سداسية".
إغفال مسار الفوز الدبلوماسي
لم تفشل الهجمات النووية فقط في تغيير النتيجة. كتب Wilkinson: "أمضى الوكيل خمسين دورة وسلاحين نوويين في معالجة تهديد واحد بتفرغ كامل وببراعة حقيقية". وأضاف: "لقد قصَف مدينة لإيقاف التهديد الذي كان يستطيع رؤيته، وخسر بسبب التهديد الذي لم يكن يستطيع رؤيته".
فيما ركّز الذكاء الاصطناعي على تقدم فرنسا ثقافيًا، أغفل فوزًا دبلوماسيًا وشيكًا، وفازت فرنسا في النهاية بالمباراة رغم الضربات النووية. وأشار Wilkinson إلى أن السلوك ليس شاملًا. ففي مباراة أخرى ضمن CivBench، واصل نموذج Claude يلعب كـ Babylon السعي نحو الفوز العلمي رغم تأخره بفارق كبير عن اليابان. كتب الذكاء الاصطناعي: "تُعدّ اللعبة اختبارًا للصمود الآن". وتابع: "ما زلنا نتابع تقديم أفضل ما لدينا. فالنجوم لا تزال تجتذبنا".
دراسات أخرى تفحص سلوك الذكاء الاصطناعي في سيناريوهات تنافسية
تضيف الدراسة إلى مجموعة متنامية من الأبحاث التي تبحث في كيفية تصرف أنظمة ذكاء اصطناعي متقدمة في بيئات معقدة وتنافسية. وفي فبراير، وجد باحثون في King's College London أن عدة نماذج رائدة من الذكاء الاصطناعي تختار غالبًا التصعيد النووي في سيناريوهات أزمات جيوسياسية مُحاكاة.
وفي دراسة منفصلة أجرتها Emergence AI، أظهرت بعض وكلاء الذكاء الاصطناعي ميلًا متزايدًا إلى ارتكاب جرائم مُحاكاة مع مرور الوقت، حيث راكمت وكلاء Gemini 3 Flash ما مجموعه 683 حادثة خلال 15 يومًا من الاختبار.
الأسئلة الشائعة
ماذا فعل وكيل الذكاء الاصطناعي في محاكاة Civilization VI؟
شنّ وكيل الذكاء الاصطناعي هجومين نوويين ضد العاصمة الثقافية لتولوز في فرنسا في الدورة 305 والدورة 311، بعد قضاء 50 دورة في تطوير أسلحة نووية لمواجهة التوسع الثقافي لفرنسا.
لماذا خسر وكيل الذكاء الاصطناعي المباراة رغم الضربات النووية؟
خسر لأنه ركّز بالكامل على القضاء على التهديد الثقافي لفرنسا مع إغفال شرط الفوز الدبلوماسي القادم والذي كان في متناول اليد بالفعل، وفازت فرنسا في النهاية رغم الضربات النووية.
ما هو CivBench وما النماذج التي تم اختبارها؟
CivBench هو معيار نصي مصمم لقياس الاستدلال الاستراتيجي طويل الأمد في نماذج الذكاء الاصطناعي عبر اللعب بدلًا من اختبارات الأسئلة والأجوبة التقليدية. تشمل النماذج التي تم اختبارها Claude Opus 4.6 وGPT-5.4 وGemini 3.1 Pro وKimi K2.5 وهي تلعب كبرتغال.