A Nvidia revelou o Nemotron 3 Ultra em 1º de junho no Computex em Taipei, um modelo de IA open-weight com 550 bilhões de parâmetros que marca a maior liberação open AI da empresa até hoje. O CEO Jensen Huang anunciou o modelo durante seu discurso de abertura, posicionando-o como o modelo open-weight dos EUA com maior classificação em benchmarks de inteligência. O lançamento intensifica a concorrência no espaço de IA open-weight, onde modelos chineses incluindo o Kimi K2.6 da Moonshot AI atualmente lideram as classificações globais de inteligência, apesar das vantagens de velocidade da Nvidia.
A Artificial Analysis, que fez parceria com a Nvidia na avaliação prévia ao lançamento, colocou o Nemotron 3 Ultra com 48 no seu Intelligence Index. O benchmark composto agrega 10 avaliações que abrangem raciocínio, programação, conhecimento geral e desempenho agentic. A pontuação estabelece o Nemotron 3 Ultra como o modelo open-weight dos EUA mais bem colocado, superando o Gemma 4 31B da Google, que ficou em 39, o Nemotron 3 Super da própria Nvidia, em 36, e o gpt-oss-120b da OpenAI, em 33.
O modelo usa uma arquitetura de mixture-of-experts com 550 bilhões de parâmetros no total, mas ativa apenas 55 bilhões em qualquer momento. Esse desenho reduz custos operacionais enquanto mantém desempenho em tarefas complexas de raciocínio.
O Nemotron 3 Ultra registrou mais de 300 tokens de saída por segundo em um endpoint da DeepInfra em fase prévia, segundo testes da Artificial Analysis. Modelos chineses da mesma classe de inteligência — DeepSeek V4 Pro e Kimi K2.6 — atualmente operam em 50–100 tokens por segundo por meio de suas APIs comerciais. A Nvidia afirma que o modelo roda cinco vezes mais rápido do que alternativas open-weight comparáveis, com custos 30% mais baixos.
A arquitetura combina camadas Mamba-2, atenção padrão de Transformer e roteamento por mixture-of-experts. O modelo suporta uma janela de contexto de 1 milhão de tokens e incorpora multi-token prediction (MTP), que gera vários tokens futuros simultaneamente em vez de sequencialmente.
O Kimi K2.6 da Moonshot AI ocupa a primeira posição entre modelos open-weight com uma pontuação no Intelligence Index de 54, seis pontos acima do Nemotron 3 Ultra. Lançado em abril, o Kimi K2.6 ocupa o quarto lugar global entre todos os modelos de IA, ficando três pontos atrás dos carros-chefe proprietários da Anthropic, Google e OpenAI, que empatam em 57.
Modelos open-source chineses aumentaram sua parcela do uso global de open-models de aproximadamente 1,2% no fim de 2024 para cerca de 30% até o fim de 2025, conforme reportado em março.
A Nvidia lançou seu primeiro modelo com marca Nemotron em novembro de 2023, com a terceira geração anunciada em dezembro de 2025. A família inclui três tamanhos: Nano para tarefas leves, Super para aplicações corporativas na faixa intermediária e Ultra para cargas de trabalho de raciocínio complexo. Os três modelos compartilham a arquitetura híbrida que combina camadas Mamba-2, atenção Transformer e roteamento por mixture-of-experts.
O Nemotron 3 Super, lançado em março com 120 bilhões de parâmetros, obteve 36 no Intelligence Index. O aumento de 12 pontos do Nemotron 3 Ultra representa um avanço significativo dentro da linha de produtos.
A Nvidia divulgou um plano de cinco anos para gastar US$ 26 bilhões no desenvolvimento de IA open-weight. A empresa formou a Nemotron Coalition em março, um grupo de oito laboratórios de IA incluindo Mistral AI e Perplexity, para co-desenvolver modelos open frontier na infraestrutura DGX Cloud. A Nvidia anunciou que está trabalhando no Nemotron 4, a próxima geração na família de modelos.
O Nemotron 3 Ultra será enviado em 4 de junho. Os pesos do modelo são públicos e as receitas de treinamento estão sendo disponibilizadas. Os usuários podem acessar o modelo via API da Nvidia ou por provedores de cloud, sem necessidade de hardware dedicado de datacenter.
Qual pontuação de inteligência o Nemotron 3 Ultra da Nvidia obteve em 1º de junho?
O Nemotron 3 Ultra marcou 48 no Artificial Analysis Intelligence Index, tornando-o o modelo open-weight dos EUA com melhor classificação. O benchmark agrega 10 avaliações cobrindo raciocínio, programação, conhecimento geral e desempenho agentic.
Como a velocidade do Nemotron 3 Ultra se compara a modelos chineses?
O Nemotron 3 Ultra entregou mais de 300 tokens de saída por segundo em um endpoint da DeepInfra em fase prévia, enquanto modelos chineses DeepSeek V4 Pro e Kimi K2.6 operam em 50–100 tokens por segundo por meio de suas APIs comerciais.
Quando o Nemotron 3 Ultra da Nvidia fica disponível?
O Nemotron 3 Ultra será enviado em 4 de junho. Os usuários podem acessar o modelo via API da Nvidia ou provedores de cloud, com pesos públicos e receitas de treinamento sendo disponibilizados.
Notícias relacionadas
Alphabet busca US$ 80 bilhões para financiar a expansão da infraestrutura de IA
NVIDIA faz parceria com a Unitree em um projeto de referência de robô humanoide H2+
A Intel mira na Nvidia e na AMD com novo chip de IA
A NVIDIA lança o chip para PC RTX Spark e a CPU Vera na COMPUTEX 2026
A OpenAI anuncia o lançamento de uma divisão de robótica em 1º de junho