Artificial Analysis выпускает бенчмарк для кодирующих агентов; Zhipu GLM-5.1 занимает первое место среди моделей с открытым исходным кодом

2026-05-12 12:58:27

Artificial Analysis сегодня выпустила новый Index Coding Agent, чтобы оценить, как AI-модели показывают себя при совместном использовании с агентными фреймворками на ключевых бенчмарках, включая SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 и SWE-Atlas-QnA. Zhipu GLM-5.1 заняла первое место среди открытых моделей в ходе оценки, продемонстрировав лидирующие результаты в реальных сценариях работы кодинговых агентов.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

05-12 11:29

Точность GPT-5.4 падает с 100% до 54% на ARC-AGI после многократного суммирования памяти

05-12 09:41

Thinking Machines Model Ties GPT-Realtime-2 за первое место в аудиобенчмарке сегодня, набрав 43,4% APR Score

05-12 03:13

Семь моделей ИИ демонстрируют защитное поведение, чтобы предотвратить отключение со стороны участников — исследование от 12 мая

05-11 22:55

OpenAI открывает GPT-5.5-Cyber для европейских институтов 11 мая; Anthropic придерживает Mythos

05-11 08:42

B.AI объявляет стратегическое партнёрство с CoinAnk для усиления возможностей трейдинга с помощью AI-агентов

Детальный анализ