Meituan lança modelo LongCat-2.0 de trilhão de parâmetros com 30 trilhões de tokens em 30 de junho

Segundo a Jin10, a Meituan lançou o LongCat-2.0, um novo modelo de linguagem de grande escala com um trilhão de parâmetros, em 30 de junho, e anunciou sua disponibilidade como código aberto. O conjunto de dados de pré-treinamento do modelo ultrapassa 30 trilhões de tokens e abrange chinês, inglês, vários idiomas e código. A equipe da Meituan enfrentou desafios de hardware e computação no treinamento em larga escala em dez mil GPUs, melhorando a estabilidade do sistema e reduzindo a taxa média mensal de falhas diárias em mais de 70% por meio de mecanismos de recuperação automatizados e protocolos de verificação de consistência.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários