GLM-5.2 от Zhipu достигает точности 22,8% на ARC-AGI-2, соперничая с облегчённой версией рассуждений GPT-5.5

Согласно ARC Prize, модель GLM-5.2 от Zhipu недавно прошла официальную верификацию на бенчмарке ARC-AGI. На ARC-AGI-2 GLM-5.2 достигла точности 22,8% при средней стоимости 0,25 доллара за задание, а на более простом бенчмарке ARC-AGI-1 — 77,0% точности при стоимости 0,19 доллара за прогон.

Общая производительность GLM-5.2 сопоставима с OpenAI GPT-5.4 и GPT-5.5 в режиме низкого уровня рассуждений. ARC-AGI предназначен для оценки способностей к рассуждению на уровне AGI с помощью абстрактных задач на распознавание образов, которые никогда не встречались во время обучения.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев