Zhipu Meluncurkan GLM-5.1 High-Speed API yang Menembus Rekor Global 400 Token/detik

Menurut Beating Monitoring, Zhipu telah meluncurkan GLM-5.1 High-Speed API untuk pelanggan perusahaan tertentu, dengan kecepatan keluaran model mencapai 400 token/detik, sehingga mencatat rekor global baru untuk throughput antarmuka resmi large language model. Versi berkecepatan tinggi ini didukung oleh mesin inferensi berperforma tinggi yang dikembangkan bersama oleh Zhipu dan tim TileRT, mempertahankan seluruh kemampuan model andalan sekaligus secara signifikan mengurangi latensi melalui optimasi kernel GPU dan penjadwalan tugas berbasis tile.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar