Ascend 910C от Huawei завершила постобучение модели DeepSeek с 1,6 триллиона параметров, задействовав 1 000+ GPU

Команда Beating из Шэньчжэньского колледжа Хэтао, Шэньчжэньского отделения Харбинского технологического института, Шэньчжэньского исследовательского института больших данных, Huawei и Deepcity AI объявила об успешном завершении полного постобучения с полными параметрами для DeepSeek-V4-Pro — модели с 1,6 триллиона параметров — на отечественной инфраструктуре для ИИ. Это первый случай, когда сторонняя организация завершила полное постобучение с полными параметрами для модели такого масштаба на китайском оборудовании.

Команда использовала кластер из более чем 1 000 чипов Huawei Ascend 910C, чтобы преодолеть узкие места в коммуникациях за счет оптимизированной распределенной балансировки нагрузки. В ходе процесса постобучения на 1 500 шагах система работала без остановок, достигнув уровня загрузки FLOPs модели (MFU) свыше 30% и повысив эффективность ключевых операторов на 14%, при этом были выполнены стандарты производительности индустриального класса.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев