Segundo a Reuters, em 30 de junho, a Meituan lançou o modelo de IA de código aberto LongCat-2.0, com 1,6 trilhão de parâmetros, empregando arquitetura de Mistura Esparsa de Especialistas (Sparse MoE), treinado inteiramente em um supercluster de ASICs nacionais, sem uso de GPUs NVIDIA ou da pilha de software CUDA. A janela de contexto do modelo é de 1 milhão de tokens.
Especificações Técnicas do LongCat-2.0 e Cenários de Aplicação Alvo
O LongCat-2.0 adota a arquitetura Sparse MoE, similar às soluções da DeepSeek e da Mixtral, da Mistral: o modelo não ativa todos os 1,6 trilhão de parâmetros simultaneamente; em vez disso, um roteador interno seleciona um conjunto de submodelos especializados para cada token, reduzindo o custo de inferência em comparação a um modelo denso de igual porte. As principais especificações técnicas e limitações de implantação são:
Quantidade de parâmetros: 1,6 trilhão (arquitetura Sparse MoE, sem ativação total simultânea)
Janela de contexto: 1 milhão de tokens (DeepSeek-R1-0528 e GPT-OSS têm 128 mil cada)
Hardware de treinamento: Supercluster de ASICs nacionais (sem GPUs NVIDIA, sem pilha CUDA)
Aplicações-alvo: Agentes de IA, ferramentas de codificação (compreensão de código, edição em toda a base, tarefas automatizadas)
Forma de implantação: Cluster de inferência em datacenter; não compatível com dispositivos de consumo ou maioria das implantações locais
Contexto de Mercado do Treinamento com Chips Nacionais e Dados da Bernstein
A Meituan afirma que a arquitetura central de inferência do LongCat-2.0 é portável e pode ser executada no hardware chinês existente. O lançamento ocorre em meio a restrições contínuas de exportação dos EUA que limitam a venda de chips avançados de IA para empresas chinesas.
A empresa de pesquisa Bernstein estima que a NVIDIA detém atualmente cerca de 40% do mercado chinês de chips de IA, participação similar à da Huawei; a Bernstein prevê que a Huawei avançará este ano, reduzindo a participação da NVIDIA no mercado chinês em cerca de 8 pontos percentuais.
Estado Atual das Alegações de Desempenho: Nenhuma Verificação por Terceiros
Em benchmarks divulgados, a Meituan comparou o LongCat-2.0 com diversos modelos de código fechado, mas as reportagens indicam que essas alegações de desempenho ainda não receberam verificação independente e imparcial de terceiros.
A reportagem também aponta que a otimização para chips nacionais pode limitar o desempenho do LongCat-2.0 em hardware NVIDIA, que ainda domina os datacenters globais. A Meituan afirma que sua arquitetura central de inferência continua portável, e testes independentes determinarão a adoção por desenvolvedores fora da China.
Perguntas Frequentes
Para quais aplicações a janela de contexto de 1 milhão de tokens do LongCat-2.0 é significativa?
No momento da reportagem, DeepSeek-R1-0528 e OpenAI GPT-OSS possuem janelas de contexto limitadas a 128 mil tokens; o LongCat-2.0 alega atingir 1 milhão de tokens, o que é potencialmente relevante para aplicações de agentes de IA que precisam processar bases de código muito longas e cadeias de tarefas complexas. No entanto, essas especificações ainda aguardam verificação independente.
Qual é o histórico de P&D em IA da Meituan?
O negócio principal da Meituan é entrega de comida e serviços locais. Em 2023, adquiriu a startup de IA Light Year Beyond por US$ 281 milhões, entrando no campo da IA. Só em 2025 anunciou publicamente planos para modelos internos. O LongCat-2.0 é posicionado como o motor de inferência para seus agentes de IA e ferramentas de codificação.
Quais são as vantagens e desvantagens da arquitetura Sparse MoE do LongCat-2.0 em comparação a um modelo denso de 1,6 trilhão?
A principal vantagem do Sparse MoE é que não ativa todos os parâmetros, roteando para submodelos específicos, reduzindo o custo computacional de inferência em relação a um modelo denso de porte equivalente. No entanto, a arquitetura otimizada para hardware específico (como ASICs nacionais) pode ter limitações de desempenho em outros hardwares (como GPUs NVIDIA); resultados de testes independentes ainda não foram divulgados.