DeepSeek V4 é lançado com janela de contexto de 1M; chips Huawei Ascend e Cambricon alcançam compatibilidade total

Mensagem do Gate News, 24 de abril — DeepSeek V4-Pro e DeepSeek V4-Flash foram oficialmente lançados e tiveram seu código aberto em 24 de abril, com o comprimento de processamento de contexto sendo expandido significativamente de 128K para 1M, representando um aumento de capacidade de quase 10 vezes. A Huawei Computing anunciou que seus produtos de supernó Ascend suportam totalmente os modelos da série DeepSeek V4 por meio de estreita colaboração entre tecnologias de chip e de modelo.

O Ascend 950 da Huawei atinge implantação de inferência do modelo DeepSeek V4 com alta taxa de transferência e baixa latência por meio de técnicas de kernel fundido e paralelismo de múltiplos streams para reduzir a sobrecarga de computação de Attention e de acesso à memória. Para o DeepSeek V4-Pro com entrada de 8K, o Ascend 950 atinge aproximadamente 20ms de TPOT com 4.700 TPS de throughput de Decode de cartão único; para o DeepSeek V4-Flash com entrada abaixo de 8K, ele alcança aproximadamente 10ms de TPOT com throughput de 1.600 TPS. A série de supernós Ascend A3 também alcança compatibilidade total, com implementações de referência de treinamento fornecidas para ajuste fino rápido. Com base no supernó Ascend A3 de 64 cartões com modo EP grande, o DeepSeek V4-Flash atinge mais de 2.000 TPS de throughput de Decode de cartão único em cenários de entrada/saída de 8K/1K usando o mecanismo de inferência vLLM. As linhas completas de produtos Ascend A2, A3 e 950 da Huawei suportam tanto o DeepSeek V4-Flash quanto o V4-Pro.

A Huawei Cloud anunciou compatibilidade de primeira-mover com o DeepSeek V4, fornecendo aos desenvolvedores serviços de token de API com um clique por meio de sua plataforma MaaS. A Huawei Cloud otimizou as capacidades de camada do sistema, camada de operadores e camada de cluster para garantir adaptação rápida do modelo e implantação com alto desempenho. Empresas incluindo Kingsoft WPS e 360 já integraram o novo modelo da DeepSeek via a Huawei Cloud.

A Cambricon também anunciou compatibilidade Day 0 com o DeepSeek V4-Flash e V4-Pro com base na estrutura de inferência vLLM, com código de adaptação em código aberto para a comunidade do GitHub. A Cambricon anteriormente alcançou adaptação de primeira-mover quando o DeepSeek V3.2 foi lançado no ano passado, tendo realizado profunda otimização de desempenho colaborativa software-hardware nos modelos da série DeepSeek.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

xAI faz parceria com a Anthropic para oferecer acesso a computação Colossus

De acordo com declarações oficiais da xAI e da Anthropic, as duas empresas estabeleceram uma nova parceria de computação. A SpaceX's xAI assinou um acordo para fornecer à Anthropic acesso aos recursos de computação do Colossus. A Anthropic planeja aproveitar essa capacidade computacional adicional para

GateNews19m atrás

A OpenAI divulga o protocolo de rede do supercomputador MRC! Em parceria com a Nvidia, AMD e a Microsoft para criar a infraestrutura do Stargate

A OpenAI publicou o protocolo MRC para a rede de supercomputação de IA, em parceria com AMD, Microsoft, NVIDIA e outros, e com código aberto na OCP. O MRC divide os dados para trafegar por vários caminhos, desvia de obstáculos em nível de microssegundos, reduz a congestão e mantém a sincronização de GPUs, resolvendo o gargalo de transmissão em grandes clusters de treinamento. Instalações como Stargate, no Texas (Abilene), já implantaram interfaces de 800 Gb/s e colocaram o sistema em uso em treinos reais.

ChainNewsAbmedia45m atrás

Plataforma de recrutamento com IA, Ethos, conclui captação de US$ 22,75 milhões em Série A liderada pela a16z em 6 de maio

De acordo com a BlockBeats, a plataforma de recrutamento de IA com sede em Londres Ethos concluiu uma captação de US$ 22,75 milhões na Série A em 6 de maio, com Andreessen Horowitz (a16z) liderando a rodada e a General Catalyst participando. A plataforma usa IA para entrevistar candidatos e analisa

GateNews1h atrás

A OpenAI Lança Protocolo de Rede MRC com AMD, Intel e NVIDIA; Suporta 100.000+ GPUs

De acordo com o anúncio da OpenAI em 6 de maio, a empresa fez parceria com a AMD, Broadcom, Intel, Microsoft e NVIDIA para lançar o Multipath Reliable Connection (MRC), um protocolo de rede aberto para interconexão de GPUs em clusters de treinamento de IA em larga escala. O protocolo divide uma única transmissão de dados em múltiplos caminhos

GateNews2h atrás

As ações da Hut 8 disparam 34% em acordo de locação de data center de IA de US$ 9,8 bilhões

De acordo com a The Block, as ações da Hut 8 Corp. dispararam 34% para US$ 107,87 no pré-mercado hoje depois que a empresa assinou um contrato de arrendamento de US$ 9,8 bilhões para um campus de data center de inteligência artificial no condado de Nueces, no Texas, projetado para a arquitetura de computação da NVIDIA. O acordo representa a primeira fase do Hu

GateNews3h atrás

CleanSpark CTO: A infraestrutura de IA/HPC exige mais recursos de rede do que a mineração de Bitcoin

Em uma entrevista ao CoinDesk, o diretor de tecnologia (CTO) da CleanSpark, Taylor Monnig, afirmou que a transição da mineração de Bitcoin para a infraestrutura de IA/HPC exige mais redundância e menos improviso. “A fibra de rede de um único rack supera a de toda uma instalação de mineração de Bitcoin”, Monnig

GateNews3h atrás
Comentário
0/400
Sem comentários