Meituan LongCat-2.0 open source: 1,6 trilhão de parâmetros, sem GPU NVIDIA

2026-07-01 02:46:54

Segundo a Reuters, em 30 de junho, a Meituan lançou o modelo de IA de código aberto LongCat-2.0, com 1,6 trilhão de parâmetros, empregando arquitetura de Mistura Esparsa de Especialistas (Sparse MoE), treinado inteiramente em um supercluster de ASICs nacionais, sem uso de GPUs NVIDIA ou da pilha de software CUDA. A janela de contexto do modelo é de 1 milhão de tokens.

Especificações Técnicas do LongCat-2.0 e Cenários de Aplicação Alvo

O LongCat-2.0 adota a arquitetura Sparse MoE, similar às soluções da DeepSeek e da Mixtral, da Mistral: o modelo não ativa todos os 1,6 trilhão de parâmetros simultaneamente; em vez disso, um roteador interno seleciona um conjunto de submodelos especializados para cada token, reduzindo o custo de inferência em comparação a um modelo denso de igual porte. As principais especificações técnicas e limitações de implantação são:

Quantidade de parâmetros: 1,6 trilhão (arquitetura Sparse MoE, sem ativação total simultânea)

Janela de contexto: 1 milhão de tokens (DeepSeek-R1-0528 e GPT-OSS têm 128 mil cada)

Hardware de treinamento: Supercluster de ASICs nacionais (sem GPUs NVIDIA, sem pilha CUDA)

Aplicações-alvo: Agentes de IA, ferramentas de codificação (compreensão de código, edição em toda a base, tarefas automatizadas)

Forma de implantação: Cluster de inferência em datacenter; não compatível com dispositivos de consumo ou maioria das implantações locais

Contexto de Mercado do Treinamento com Chips Nacionais e Dados da Bernstein

A Meituan afirma que a arquitetura central de inferência do LongCat-2.0 é portável e pode ser executada no hardware chinês existente. O lançamento ocorre em meio a restrições contínuas de exportação dos EUA que limitam a venda de chips avançados de IA para empresas chinesas.

A empresa de pesquisa Bernstein estima que a NVIDIA detém atualmente cerca de 40% do mercado chinês de chips de IA, participação similar à da Huawei; a Bernstein prevê que a Huawei avançará este ano, reduzindo a participação da NVIDIA no mercado chinês em cerca de 8 pontos percentuais.

Estado Atual das Alegações de Desempenho: Nenhuma Verificação por Terceiros

Em benchmarks divulgados, a Meituan comparou o LongCat-2.0 com diversos modelos de código fechado, mas as reportagens indicam que essas alegações de desempenho ainda não receberam verificação independente e imparcial de terceiros.

A reportagem também aponta que a otimização para chips nacionais pode limitar o desempenho do LongCat-2.0 em hardware NVIDIA, que ainda domina os datacenters globais. A Meituan afirma que sua arquitetura central de inferência continua portável, e testes independentes determinarão a adoção por desenvolvedores fora da China.

Perguntas Frequentes

Para quais aplicações a janela de contexto de 1 milhão de tokens do LongCat-2.0 é significativa?

No momento da reportagem, DeepSeek-R1-0528 e OpenAI GPT-OSS possuem janelas de contexto limitadas a 128 mil tokens; o LongCat-2.0 alega atingir 1 milhão de tokens, o que é potencialmente relevante para aplicações de agentes de IA que precisam processar bases de código muito longas e cadeias de tarefas complexas. No entanto, essas especificações ainda aguardam verificação independente.

Qual é o histórico de P&D em IA da Meituan?

O negócio principal da Meituan é entrega de comida e serviços locais. Em 2023, adquiriu a startup de IA Light Year Beyond por US$ 281 milhões, entrando no campo da IA. Só em 2025 anunciou publicamente planos para modelos internos. O LongCat-2.0 é posicionado como o motor de inferência para seus agentes de IA e ferramentas de codificação.

Quais são as vantagens e desvantagens da arquitetura Sparse MoE do LongCat-2.0 em comparação a um modelo denso de 1,6 trilhão?

A principal vantagem do Sparse MoE é que não ativa todos os parâmetros, roteando para submodelos específicos, reduzindo o custo computacional de inferência em relação a um modelo denso de porte equivalente. No entanto, a arquitetura otimizada para hardware específico (como ASICs nacionais) pode ter limitações de desempenho em outros hardwares (como GPUs NVIDIA); resultados de testes independentes ainda não foram divulgados.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

06-30 07:07

Meituan Lança Modelo de IA LongCat-2.0 com 1,6 Trilhões de Parâmetros em 30 de Junho

06-30 05:07

Huawei lança modelo openPangu-2.0-Flash como código aberto em 30 de junho

06-30 03:19

Meituan lança LongCat-2.0, modelo de 1,6 trilhão de parâmetros figura entre os 3 primeiros no OpenRouter

Google lança modelo de geração de imagens de menor custo, US$ 0,034 por mil imagens.

Market Whisper7h atrás

IA de conversão cerebral em texto da Meta atinge 61% de precisão, código aberto é lançado simultaneamente.

Market Whisper06-30 07:17

OpenAI anuncia o lançamento do teclado macro Codex, lançado em 15 de julho.

Market Whisper06-30 03:41

Alerta do Lado Sombrio da Lua: fraudes de financiamento são frequentes; transações não autorizadas de ações antigas são inválidas.

Market Whisper06-30 02:46

Vulnerabilidade de cota do Codex colapsa novamente, OpenAI realiza segundo hard reset

Market Whisper06-29 05:47

Comentário

0/400

Sem comentários