Tim Shenzhen Menyelesaikan Pelatihan Model DeepSeek-V4-Pro dengan 1,6 Triliun Parameter pada Chip Ascend 910C Buatan Sendiri di Rumah

Menurut Shenzhen Release, pada 5 Juni, sebuah tim proyek dari Shenzhen Hezhou Academy, bekerja sama dengan Harbin Institute of Technology (Shenzhen), Shenzhen Big Data Institute, Huawei, dan platform komputasi AI Deep Intelligence City's, menyelesaikan full-parameter post-training untuk model DeepSeek-V4-Pro berparameter 1,6 triliun menggunakan klaster komputasi AI domestik Ascend 910C. Ini menandai salah satu contoh awal organisasi pihak ketiga yang menyelesaikan pelatihan model pada skala sebesar ini di platform komputasi domestik Tiongkok, yang menunjukkan bahwa chip AI dalam negeri dapat mendukung pelatihan model skala besar kelas dunia.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar