إطلاق منصة Artificial Analysis لمعيار وكيل برمجي؛ تتصدر Zhipu GLM-5.1 الترتيب بين النماذج مفتوحة المصدر

أصدرت Artificial Analysis اليوم مؤشرًا جديدًا لوكلاء البرمجة (Coding Agent Index) لتقييم أداء نماذج الذكاء الاصطناعي عند دمجها مع أطر الوكلاء عبر معايير رئيسية، بما في ذلك SWE-Bench-Pro-Hard-AA وTerminal-Bench v2 وSWE-Atlas-QnA. وجاءت Zhipu GLM-5.1 في الصدارة بين النماذج مفتوحة المصدر في التقييم، ما يُظهر أداءً رائدًا في سيناريوهات فعلية لوكلاء البرمجة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات