Zhipu выпускает высокоскоростной API GLM-5.1 с рекордом 400 токенов/с по всему миру

Beating Monitoring сообщает, что Zhipu запустила GLM-5.1 High-Speed API для избранных корпоративных клиентов; скорость вывода модели достигает 400 токенов/с, что устанавливает новый мировой рекорд по пропускной способности официального интерфейса больших языковых моделей. Высокоскоростная версия работает на высокопроизводительном механизме инференса, совместно разработанном Zhipu и командой TileRT, сохраняя полный функционал флагманской модели и при этом существенно снижая задержку благодаря оптимизации GPU-ядра и планированию задач на уровне тайлов.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев