A Nvidia revela o Nemotron 3 Ultra na Computex, colocando o Kimi K2.6 da China em vantagem nas classificações de inteligência

A Nvidia revelou o Nemotron 3 Ultra a 1 de junho, durante o Computex, em Taipei, um modelo de IA open-weight com 550 mil milhões de parâmetros, que marca a maior estreia de IA open da empresa até à data. O CEO Jensen Huang anunciou o modelo no seu discurso de abertura, posicionando-o como o modelo open-weight dos EUA com melhor classificação em benchmarks de inteligência. O lançamento intensifica a concorrência no espaço de IA open-weight, onde modelos chineses, incluindo o Kimi K2.6 da Moonshot AI, lideram atualmente os rankings globais de inteligência, apesar das vantagens de velocidade da Nvidia.

Nemotron 3 Ultra Marca 48 no Benchmark Intelligence Index

A Artificial Analysis, que fez parceria com a Nvidia na avaliação pré-lançamento, colocou o Nemotron 3 Ultra com 48 no seu Intelligence Index. O benchmark composto agrega 10 avaliações que abrangem raciocínio, programação, conhecimentos gerais e desempenho agentico. A pontuação posiciona o Nemotron 3 Ultra como o modelo open-weight dos EUA mais bem classificado, ultrapassando o Gemma 4 31B da Google, com 39, o Nemotron 3 Super da própria Nvidia, com 36, e o gpt-oss-120b da OpenAI, com 33.

O modelo recorre a uma arquitetura de mistura de especialistas, com 550 mil milhões de parâmetros no total, mas ativando apenas 55 mil milhões em qualquer momento. Este desenho reduz custos operacionais, mantendo o desempenho em tarefas complexas de raciocínio.

O Modelo Entrega 300+ Tokens por Segundo no Endpoint Pré-Lançamento

O Nemotron 3 Ultra entregou mais de 300 tokens de saída por segundo num endpoint DeepInfra pré-lançado, segundo testes da Artificial Analysis. Modelos chineses na mesma classe de inteligência — DeepSeek V4 Pro e Kimi K2.6 — operam atualmente a 50–100 tokens por segundo através das suas APIs comerciais. A Nvidia afirma que o modelo é cinco vezes mais rápido do que alternativas open-weight comparáveis, com custos 30% mais baixos.

A arquitetura combina camadas Mamba-2, atenção standard do Transformer e routing por mistura de especialistas. O modelo suporta uma janela de contexto de 1 milhão de tokens e inclui multi-token prediction (MTP), que gera vários tokens futuros em simultâneo, em vez de os produzir de forma sequencial.

Kimi K2.6 Lidera os Rankings Open-Weight com 54 na Pontuação de Inteligência

O Kimi K2.6 da Moonshot AI ocupa o primeiro lugar entre os modelos open-weight com uma pontuação de Intelligence Index de 54, seis pontos acima do Nemotron 3 Ultra. Lançado em abril, o Kimi K2.6 está no 4.º lugar a nível global entre todos os modelos de IA, situando-se três pontos abaixo dos flagships proprietários da Anthropic, Google e OpenAI, que empatam nos 57.

Modelos open-source chineses aumentaram a sua quota no uso global de open-models de aproximadamente 1,2% no final de 2024 para cerca de 30% até ao final de 2025, conforme reportado em março.

A Família Nemotron Vai por Três Tamanhos de Modelos Desde 2023

A Nvidia lançou o seu primeiro modelo com a marca Nemotron em novembro de 2023, com a 3.ª geração anunciada em dezembro de 2025. A família inclui três tamanhos: Nano para tarefas leves, Super para aplicações empresariais intermédias, e Ultra para cargas de trabalho de raciocínio complexo. Os três modelos partilham a arquitetura híbrida que combina camadas Mamba-2, atenção do Transformer e routing por mistura de especialistas.

O Nemotron 3 Super, lançado em março com 120 mil milhões de parâmetros, obteve 36 no Intelligence Index. O aumento de 12 pontos do Nemotron 3 Ultra representa um avanço significativo na linha de produtos.

Nvidia Destina 26 mil milhões de dólares ao Desenvolvimento de IA Open-Weight

A Nvidia revelou um plano de cinco anos para gastar 26 mil milhões de dólares no desenvolvimento de IA open-weight. A empresa criou a Nemotron Coalition em março, um grupo de oito laboratórios de IA incluindo Mistral AI e Perplexity, para co-desenvolver modelos frontier abertos na infraestrutura DGX Cloud. A Nvidia anunciou que está a trabalhar no Nemotron 4, a próxima geração da família de modelos.

O Modelo Chega a 4 de junho via API da Nvidia e Provedores de Cloud

O Nemotron 3 Ultra chega a 4 de junho. Os pesos do modelo são públicos e as receitas de treino estão a ser disponibilizadas. Os utilizadores podem aceder ao modelo através da API da Nvidia ou de provedores de cloud, sem necessidade de hardware dedicado de datacenter.

FAQ

Que pontuação de inteligência alcançou o Nemotron 3 Ultra da Nvidia em 1 de junho?
O Nemotron 3 Ultra obteve 48 no Artificial Analysis Intelligence Index, tornando-o no modelo open-weight dos EUA com melhor classificação. O benchmark agrega 10 avaliações que cobrem raciocínio, programação, conhecimentos gerais e desempenho agentico.

Como é que a velocidade do Nemotron 3 Ultra se compara com a dos modelos chineses?
O Nemotron 3 Ultra entregou mais de 300 tokens de saída por segundo num endpoint DeepInfra pré-lançado, enquanto os modelos chineses DeepSeek V4 Pro e Kimi K2.6 operam a 50–100 tokens por segundo através das suas APIs comerciais.

Quando é que o Nemotron 3 Ultra da Nvidia fica disponível?
O Nemotron 3 Ultra chega a 4 de junho. Os utilizadores podem aceder ao modelo através da API da Nvidia ou de provedores de cloud, com os pesos públicos e as receitas de treino a serem disponibilizadas.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário