A Nvidia revelou o Nemotron 3 Ultra a 1 de junho, durante o Computex, em Taipei, um modelo de IA open-weight com 550 mil milhões de parâmetros, que marca a maior estreia de IA open da empresa até à data. O CEO Jensen Huang anunciou o modelo no seu discurso de abertura, posicionando-o como o modelo open-weight dos EUA com melhor classificação em benchmarks de inteligência. O lançamento intensifica a concorrência no espaço de IA open-weight, onde modelos chineses, incluindo o Kimi K2.6 da Moonshot AI, lideram atualmente os rankings globais de inteligência, apesar das vantagens de velocidade da Nvidia.
A Artificial Analysis, que fez parceria com a Nvidia na avaliação pré-lançamento, colocou o Nemotron 3 Ultra com 48 no seu Intelligence Index. O benchmark composto agrega 10 avaliações que abrangem raciocínio, programação, conhecimentos gerais e desempenho agentico. A pontuação posiciona o Nemotron 3 Ultra como o modelo open-weight dos EUA mais bem classificado, ultrapassando o Gemma 4 31B da Google, com 39, o Nemotron 3 Super da própria Nvidia, com 36, e o gpt-oss-120b da OpenAI, com 33.
O modelo recorre a uma arquitetura de mistura de especialistas, com 550 mil milhões de parâmetros no total, mas ativando apenas 55 mil milhões em qualquer momento. Este desenho reduz custos operacionais, mantendo o desempenho em tarefas complexas de raciocínio.
O Nemotron 3 Ultra entregou mais de 300 tokens de saída por segundo num endpoint DeepInfra pré-lançado, segundo testes da Artificial Analysis. Modelos chineses na mesma classe de inteligência — DeepSeek V4 Pro e Kimi K2.6 — operam atualmente a 50–100 tokens por segundo através das suas APIs comerciais. A Nvidia afirma que o modelo é cinco vezes mais rápido do que alternativas open-weight comparáveis, com custos 30% mais baixos.
A arquitetura combina camadas Mamba-2, atenção standard do Transformer e routing por mistura de especialistas. O modelo suporta uma janela de contexto de 1 milhão de tokens e inclui multi-token prediction (MTP), que gera vários tokens futuros em simultâneo, em vez de os produzir de forma sequencial.
O Kimi K2.6 da Moonshot AI ocupa o primeiro lugar entre os modelos open-weight com uma pontuação de Intelligence Index de 54, seis pontos acima do Nemotron 3 Ultra. Lançado em abril, o Kimi K2.6 está no 4.º lugar a nível global entre todos os modelos de IA, situando-se três pontos abaixo dos flagships proprietários da Anthropic, Google e OpenAI, que empatam nos 57.
Modelos open-source chineses aumentaram a sua quota no uso global de open-models de aproximadamente 1,2% no final de 2024 para cerca de 30% até ao final de 2025, conforme reportado em março.
A Nvidia lançou o seu primeiro modelo com a marca Nemotron em novembro de 2023, com a 3.ª geração anunciada em dezembro de 2025. A família inclui três tamanhos: Nano para tarefas leves, Super para aplicações empresariais intermédias, e Ultra para cargas de trabalho de raciocínio complexo. Os três modelos partilham a arquitetura híbrida que combina camadas Mamba-2, atenção do Transformer e routing por mistura de especialistas.
O Nemotron 3 Super, lançado em março com 120 mil milhões de parâmetros, obteve 36 no Intelligence Index. O aumento de 12 pontos do Nemotron 3 Ultra representa um avanço significativo na linha de produtos.
A Nvidia revelou um plano de cinco anos para gastar 26 mil milhões de dólares no desenvolvimento de IA open-weight. A empresa criou a Nemotron Coalition em março, um grupo de oito laboratórios de IA incluindo Mistral AI e Perplexity, para co-desenvolver modelos frontier abertos na infraestrutura DGX Cloud. A Nvidia anunciou que está a trabalhar no Nemotron 4, a próxima geração da família de modelos.
O Nemotron 3 Ultra chega a 4 de junho. Os pesos do modelo são públicos e as receitas de treino estão a ser disponibilizadas. Os utilizadores podem aceder ao modelo através da API da Nvidia ou de provedores de cloud, sem necessidade de hardware dedicado de datacenter.
Que pontuação de inteligência alcançou o Nemotron 3 Ultra da Nvidia em 1 de junho?
O Nemotron 3 Ultra obteve 48 no Artificial Analysis Intelligence Index, tornando-o no modelo open-weight dos EUA com melhor classificação. O benchmark agrega 10 avaliações que cobrem raciocínio, programação, conhecimentos gerais e desempenho agentico.
Como é que a velocidade do Nemotron 3 Ultra se compara com a dos modelos chineses?
O Nemotron 3 Ultra entregou mais de 300 tokens de saída por segundo num endpoint DeepInfra pré-lançado, enquanto os modelos chineses DeepSeek V4 Pro e Kimi K2.6 operam a 50–100 tokens por segundo através das suas APIs comerciais.
Quando é que o Nemotron 3 Ultra da Nvidia fica disponível?
O Nemotron 3 Ultra chega a 4 de junho. Os utilizadores podem aceder ao modelo através da API da Nvidia ou de provedores de cloud, com os pesos públicos e as receitas de treino a serem disponibilizadas.
Notícias relacionadas
Alphabet procura 80 mil milhões de dólares para financiar a expansão da infraestrutura de IA
A NVIDIA faz parceria com a Unitree num projeto de referência de robô humanoide H2+
A Intel mira a Nvidia e a AMD com um novo chip de IA
A NVIDIA lança o chip RTX Spark PC e o CPU Vera na COMPUTEX 2026
A OpenAI anuncia o lançamento de uma divisão de robótica a 1 de junho