Команда из Шэньчжэня завершила обучение модели DeepSeek-V4-Pro на 1,6 триллиона параметров на собственном чипе Ascend 910C, разработанном в Китае

Согласно Shenzhen Release, 5 июня команда проекта из Shenzhen Hezhou Academy в сотрудничестве с Harbin Institute of Technology (Shenzhen), Shenzhen Big Data Institute, Huawei и платформой ИИ-вычислений AI computing platform Deep Intelligence City завершила полнопараметрическое постобучение модели DeepSeek-V4-Pro с 1,6 триллиона параметров, используя отечественный вычислительный кластер Ascend 910C. Это один из первых случаев, когда сторонняя организация завершила обучение модели в таком масштабе на китайской отечественной вычислительной платформе, демонстрируя, что отечественные чипы для ИИ могут поддерживать обучение крупномасштабных моделей мирового класса.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев