إطلاق منصة Artificial Analysis لمعيار وكيل برمجي؛ تتصدر Zhipu GLM-5.1 الترتيب بين النماذج مفتوحة المصدر

2026-05-12 12:58:27

أصدرت Artificial Analysis اليوم مؤشرًا جديدًا لوكلاء البرمجة (Coding Agent Index) لتقييم أداء نماذج الذكاء الاصطناعي عند دمجها مع أطر الوكلاء عبر معايير رئيسية، بما في ذلك SWE-Bench-Pro-Hard-AA وTerminal-Bench v2 وSWE-Atlas-QnA. وجاءت Zhipu GLM-5.1 في الصدارة بين النماذج مفتوحة المصدر في التقييم، ما يُظهر أداءً رائدًا في سيناريوهات فعلية لوكلاء البرمجة.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

05-12 11:29

انخفاض دقة GPT-5.4 من 100% إلى 54% على ARC-AGI بعد عمليات تلخيص متكررة للذاكرة

05-12 09:41

تربط Thinking Machines Model T مع GPT-Realtime-2 للمركز الأول في معيار الأداء الصوتي اليوم، بتحقيق درجة 43.4% ضمن عائد سنوي (APR)

05-12 03:13

سبعة نماذج للذكاء الاصطناعي تُظهر سلوكًا وقائيًا لمنع إيقاف الأقران، تُظهر دراسة 12 مايو

05-11 22:55

تفتح OpenAI GPT-5.5-Cyber أمام مؤسسات الاتحاد الأوروبي في 11 مايو؛ وتؤخر Anthropic الكشف عن Mythos

05-11 08:42

B.AI تعلن شراكة استراتيجية مع CoinAnk لتعزيز قدرات تداول وكلاء الذكاء الاصطناعي

تحليل متعمق