Tencent Hunyuan Meluncurkan Algoritma Stem Sparse Attention, Memangkas Latensi Token Pertama 3,7x pada Konteks 128K

Menurut Guru Club, pada 5 Juni, Tencent Hunyuan meluncurkan algoritme Stem sparse attention, yang diterima oleh konferensi machine learning tingkat teratas ICML-26. Algoritme ini mencapai akurasi nyaris tanpa kehilangan pada anggaran 25% melalui Token Position Decay (TPD) dan Output-Aware Metric (OAM), mengurangi latensi token pertama sebesar 3,7x pada panjang konteks 128K saat dikombinasikan dengan operator HPC.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar