يتصدر Zhipu GLM-5.2 معيار DeepSWE مفتوح المصدر بنتيجة نجاح 44%، متفوقاً على نماذج رئيسية مغلقة المصدر

وفقاً لحساب مراقبة باسم Beating، حقق نموذج Zhipu AI مفتوح المصدر GLM-5.2 أعلى معدل نجاح بين نماذج open-source على معيار DeepSWE لمهام هندسة برمجيات معقدة، مسجلاً معدل نجاح من المحاولة الواحدة بنسبة 44% عند أقصى شدة للاستدلال. ويتفوق ذلك على Kimi K2.7 Code بنسبة 31% بفارق 13 نقطة مئوية.

وبسعر 3.92 دولار لكل مهمة، يتجاوز GLM-5.2 أداء عدة نماذج مغلقة المصدر سائدة في ظل إعدادات استدلال محددة، بما في ذلك Claude Sonnet 4.6 [high] بنسبة 30%، وGemini 3.5 Flash [medium] بنسبة 37%، وClaude Opus 4.8 [low] بنسبة 41%.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات