A Nvidia revela o Nemotron 3 Ultra na Computex, acompanhando o Kimi K2.6 da China nas classificações de inteligência

A Nvidia revelou o Nemotron 3 Ultra em 1º de junho no Computex em Taipei, um modelo de IA open-weight com 550 bilhões de parâmetros que marca a maior liberação open AI da empresa até hoje. O CEO Jensen Huang anunciou o modelo durante seu discurso de abertura, posicionando-o como o modelo open-weight dos EUA com maior classificação em benchmarks de inteligência. O lançamento intensifica a concorrência no espaço de IA open-weight, onde modelos chineses incluindo o Kimi K2.6 da Moonshot AI atualmente lideram as classificações globais de inteligência, apesar das vantagens de velocidade da Nvidia.

Nemotron 3 Ultra Obtém 48 no Benchmark do Intelligence Index

A Artificial Analysis, que fez parceria com a Nvidia na avaliação prévia ao lançamento, colocou o Nemotron 3 Ultra com 48 no seu Intelligence Index. O benchmark composto agrega 10 avaliações que abrangem raciocínio, programação, conhecimento geral e desempenho agentic. A pontuação estabelece o Nemotron 3 Ultra como o modelo open-weight dos EUA mais bem colocado, superando o Gemma 4 31B da Google, que ficou em 39, o Nemotron 3 Super da própria Nvidia, em 36, e o gpt-oss-120b da OpenAI, em 33.

O modelo usa uma arquitetura de mixture-of-experts com 550 bilhões de parâmetros no total, mas ativa apenas 55 bilhões em qualquer momento. Esse desenho reduz custos operacionais enquanto mantém desempenho em tarefas complexas de raciocínio.

O Modelo Entrega 300+ Tokens por Segundo no Endpoint Prévia

O Nemotron 3 Ultra registrou mais de 300 tokens de saída por segundo em um endpoint da DeepInfra em fase prévia, segundo testes da Artificial Analysis. Modelos chineses da mesma classe de inteligência — DeepSeek V4 Pro e Kimi K2.6 — atualmente operam em 50–100 tokens por segundo por meio de suas APIs comerciais. A Nvidia afirma que o modelo roda cinco vezes mais rápido do que alternativas open-weight comparáveis, com custos 30% mais baixos.

A arquitetura combina camadas Mamba-2, atenção padrão de Transformer e roteamento por mixture-of-experts. O modelo suporta uma janela de contexto de 1 milhão de tokens e incorpora multi-token prediction (MTP), que gera vários tokens futuros simultaneamente em vez de sequencialmente.

Kimi K2.6 Lidera as Classificações Open-Weight com 54 no Intelligence Score

O Kimi K2.6 da Moonshot AI ocupa a primeira posição entre modelos open-weight com uma pontuação no Intelligence Index de 54, seis pontos acima do Nemotron 3 Ultra. Lançado em abril, o Kimi K2.6 ocupa o quarto lugar global entre todos os modelos de IA, ficando três pontos atrás dos carros-chefe proprietários da Anthropic, Google e OpenAI, que empatam em 57.

Modelos open-source chineses aumentaram sua parcela do uso global de open-models de aproximadamente 1,2% no fim de 2024 para cerca de 30% até o fim de 2025, conforme reportado em março.

A Família Nemotron Vai de Três Tamanhos de Modelo desde 2023

A Nvidia lançou seu primeiro modelo com marca Nemotron em novembro de 2023, com a terceira geração anunciada em dezembro de 2025. A família inclui três tamanhos: Nano para tarefas leves, Super para aplicações corporativas na faixa intermediária e Ultra para cargas de trabalho de raciocínio complexo. Os três modelos compartilham a arquitetura híbrida que combina camadas Mamba-2, atenção Transformer e roteamento por mixture-of-experts.

O Nemotron 3 Super, lançado em março com 120 bilhões de parâmetros, obteve 36 no Intelligence Index. O aumento de 12 pontos do Nemotron 3 Ultra representa um avanço significativo dentro da linha de produtos.

Nvidia Destina US$ 26 Bilhões ao Desenvolvimento de IA Open-Weight

A Nvidia divulgou um plano de cinco anos para gastar US$ 26 bilhões no desenvolvimento de IA open-weight. A empresa formou a Nemotron Coalition em março, um grupo de oito laboratórios de IA incluindo Mistral AI e Perplexity, para co-desenvolver modelos open frontier na infraestrutura DGX Cloud. A Nvidia anunciou que está trabalhando no Nemotron 4, a próxima geração na família de modelos.

O Modelo é Enviado em 4 de Junho via API da Nvidia e Provedores de Cloud

O Nemotron 3 Ultra será enviado em 4 de junho. Os pesos do modelo são públicos e as receitas de treinamento estão sendo disponibilizadas. Os usuários podem acessar o modelo via API da Nvidia ou por provedores de cloud, sem necessidade de hardware dedicado de datacenter.

FAQ

Qual pontuação de inteligência o Nemotron 3 Ultra da Nvidia obteve em 1º de junho?
O Nemotron 3 Ultra marcou 48 no Artificial Analysis Intelligence Index, tornando-o o modelo open-weight dos EUA com melhor classificação. O benchmark agrega 10 avaliações cobrindo raciocínio, programação, conhecimento geral e desempenho agentic.

Como a velocidade do Nemotron 3 Ultra se compara a modelos chineses?
O Nemotron 3 Ultra entregou mais de 300 tokens de saída por segundo em um endpoint da DeepInfra em fase prévia, enquanto modelos chineses DeepSeek V4 Pro e Kimi K2.6 operam em 50–100 tokens por segundo por meio de suas APIs comerciais.

Quando o Nemotron 3 Ultra da Nvidia fica disponível?
O Nemotron 3 Ultra será enviado em 4 de junho. Os usuários podem acessar o modelo via API da Nvidia ou provedores de cloud, com pesos públicos e receitas de treinamento sendo disponibilizados.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários