Artificial Analysis сегодня выпустила новый Index Coding Agent, чтобы оценить, как AI-модели показывают себя при совместном использовании с агентными фреймворками на ключевых бенчмарках, включая SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 и SWE-Atlas-QnA. Zhipu GLM-5.1 заняла первое место среди открытых моделей в ходе оценки, продемонстрировав лидирующие результаты в реальных сценариях работы кодинговых агентов.
Related News
OpenAI запустила программу кибербезопасности Daybreak; трёхуровневая архитектура GPT-5.5 против Anthropic Mythos
Полное руководство по Gemini в 2026 году: вся линейка продуктов Google AI, тарифные планы, политика конфиденциальности — всё в одном месте
Stanford запускает Agent Island: AI-модели в игре в стиле Survivor устраивают стратегические предательства и взаимное устранение