Zhipu GLM-5.2 заняла первое место в открытом бенчмарке DeepSWE, показав 44% успешности, и превзошла основные закрытые модели

2026-06-21 03:05:19

Согласно Beating (мониторинговый аккаунт), открытая модель Zhipu AI GLM-5.2 показала самый высокий уровень успешности среди открытых моделей на бенчмарке DeepSWE для сложных задач по инженерии ПО: 44% успешных попыток с первого раза при максимальной интенсивности рассуждений. Это лучше, чем у Kimi K2.7 Code — 31%, разница составляет 13 процентных пунктов.

При стоимости $3,92 за задачу GLM-5.2 обходит по эффективности несколько мейнстримных закрытых моделей при определённых конфигурациях рассуждений, включая Claude Sonnet 4.6 [high] на 30%, Gemini 3.5 Flash [medium] на 37% и Claude Opus 4.8 [low] на 41%.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

06-20 01:13

Флагманская модель GLM-5.2 запускает веб-чат на платформе B.AI после выпуска API 18 июня

06-19 09:14

Разработчики из США ускоряют внедрение китайских моделей ИИ, доля DeepSeek в мае подскакивает до 17%

06-19 04:00

GLM-5.2 от Zhipu AI заняла второе место в Code Arena, набрав 51 балл по индексу искусственного анализа после релиза

06-17 09:47

GLM-5.2 от Zhipu занял первое место среди моделей с открытым исходным кодом в бенчмарке AA, набрав 51 балл, и соответствует GPT-5.5 в тесте GDPval

06-17 03:01

Z.ai запускает open-source модель ИИ GLM-5.2 с контекстом на 1 млн токенов 17 июня

Детальный анализ