A equipa de Shenzhen conclui o treino do modelo DeepSeek-V4-Pro com 1,6 biliões de parâmetros na Ascend 910C, num chip desenvolvido internamente

De acordo com o Shenzhen Release, a 5 de junho, uma equipa de projeto da Shenzhen Hezhou Academy, em colaboração com o Harbin Institute of Technology (Shenzhen), o Shenzhen Big Data Institute, a Huawei e a plataforma de computação de IA da Deep Intelligence City, concluiu o pós-treino de parâmetros completos do modelo DeepSeek-V4-Pro, com 1,6 biliões de parâmetros, utilizando o cluster doméstico de computação de IA Ascend 910C. Trata-se de um dos primeiros casos em que uma organização terceira concluiu o treino de um modelo nesta escala numa plataforma de computação doméstica chinesa, demonstrando que os chips de IA nacionais podem suportar o treino de modelos de grandes parâmetros de nível mundial.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário