A Zhipu lança a API de alta velocidade GLM-5.1, atingindo um recorde global de 400 tokens/s

De acordo com o Beating Monitoring, a Zhipu lançou a GLM-5.1 High-Speed API para clientes empresariais selecionados, com a velocidade de saída do modelo a atingir 400 tokens/s, estabelecendo um novo recorde global para o throughput da interface oficial de grandes modelos de linguagem. A versão de alta velocidade é alimentada por um motor de inferência de alto desempenho co-desenvolvido pela Zhipu e pela equipa da TileRT, mantendo toda a capacidade do modelo topo de gama e, ao mesmo tempo, reduzindo significativamente a latência através da otimização de kernels na GPU e do escalonamento de tarefas a nível de tiles.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário