Nvidia meluncurkan Nemotron 3 Ultra pada 1 Juni di Computex di Taipei, sebuah model AI open-weight dengan 550 miliar parameter yang menjadi rilis open AI terbesar perusahaan hingga saat ini. CEO Jensen Huang mengumumkan model tersebut dalam pidato keynote-nya, memposisikannya sebagai model open-weight AS dengan peringkat tertinggi pada benchmark kecerdasan. Rilis ini mengintensifkan persaingan di ruang AI open-weight, tempat model-model Tiongkok termasuk Kimi K2.6 dari Moonshot AI saat ini memimpin peringkat kecerdasan global meski Nvidia unggul dalam kecepatan.
Artificial Analysis, yang berkolaborasi dengan Nvidia dalam penilaian sebelum rilis, menempatkan Nemotron 3 Ultra di skor 48 pada Intelligence Index miliknya. Benchmark gabungan ini mengakumulasi 10 evaluasi yang mencakup penalaran, pemrograman, pengetahuan umum, dan kinerja agentic. Skor tersebut menetapkan Nemotron 3 Ultra sebagai model open-weight AS peringkat teratas, melampaui Gemma 4 31B milik Google yang bernilai 39, Nemotron 3 Super milik Nvidia yang bernilai 36, serta gpt-oss-120b milik OpenAI yang bernilai 33.
Model ini menggunakan arsitektur mixture-of-experts dengan total 550 miliar parameter, namun hanya mengaktifkan 55 miliar pada setiap waktu. Desain ini menekan biaya operasional sekaligus mempertahankan performa pada tugas penalaran yang kompleks.
Nemotron 3 Ultra menghasilkan lebih dari 300 token output per detik pada endpoint DeepInfra pra-rilis, menurut pengujian Artificial Analysis. Model Tiongkok dalam kelas kecerdasan yang sama—DeepSeek V4 Pro dan Kimi K2.6—saat ini beroperasi pada 50–100 token per detik melalui API komersial mereka. Nvidia mengklaim model ini berjalan lima kali lebih cepat dibanding alternatif open-weight yang sebanding dengan biaya 30% lebih rendah.
Arsitekturnya memadukan layer Mamba-2, atensi Transformer standar, dan routing mixture-of-experts. Model mendukung jendela konteks 1 juta token dan menggabungkan multi-token prediction (MTP), yang menghasilkan beberapa token masa depan secara bersamaan, bukan berurutan.
Kimi K2.6 milik Moonshot AI menempati posisi teratas di antara model open-weight dengan skor Intelligence Index 54, enam poin di atas Nemotron 3 Ultra. Diluncurkan pada April, Kimi K2.6 berada di peringkat keempat secara global di antara semua model AI, dengan selisih tiga poin dari flagship milik Anthropic, Google, dan OpenAI yang bernilai sama-sama 57.
Model open-source Tiongkok meningkatkan pangsa penggunaan model open global dari sekitar 1,2% pada akhir 2024 menjadi sekitar 30% pada akhir 2025, sebagaimana dilaporkan pada bulan Maret.
Nvidia merilis model pertama ber-merk Nemotron pada November 2023, dengan generasi ketiga diumumkan pada Desember 2025. Keluarga ini mencakup tiga ukuran: Nano untuk tugas ringan, Super untuk aplikasi enterprise kelas menengah, dan Ultra untuk beban kerja penalaran yang kompleks. Ketiganya menggunakan arsitektur hibrida yang menggabungkan layer Mamba-2, atensi Transformer, dan routing mixture-of-experts.
Nemotron 3 Super, yang dirilis pada Maret dengan 120 miliar parameter, meraih skor 36 pada Intelligence Index. Kenaikan 12 poin pada Nemotron 3 Ultra menandai kemajuan yang signifikan dalam lini produknya.
Nvidia mengungkapkan rencana lima tahun untuk membelanjakan 26 miliar dolar AS guna pengembangan AI open-weight. Perusahaan membentuk Nemotron Coalition pada Maret, sebuah kelompok yang berisi delapan lab AI termasuk Mistral AI dan Perplexity, untuk bersama-sama mengembangkan model open frontier di infrastruktur DGX Cloud. Nvidia mengumumkan bahwa pihaknya tengah mengerjakan Nemotron 4, generasi berikutnya dalam keluarga model tersebut.
Nemotron 3 Ultra tersedia mulai 4 Juni. Bobot model dipublikasikan dan resep pelatihannya sedang dirilis. Pengguna dapat mengakses model melalui API Nvidia atau penyedia cloud tanpa memerlukan perangkat keras datacenter khusus.
Berapa skor kecerdasan yang diraih Nvidia Nemotron 3 Ultra pada 1 Juni? Nemotron 3 Ultra meraih skor 48 pada Artificial Analysis Intelligence Index, menjadikannya model open-weight AS berperingkat tertinggi. Benchmark ini menggabungkan 10 evaluasi yang mencakup penalaran, pemrograman, pengetahuan umum, dan kinerja agentic.
Bagaimana perbandingan kecepatan Nemotron 3 Ultra dengan model Tiongkok? Nemotron 3 Ultra menyajikan lebih dari 300 token output per detik pada endpoint DeepInfra pra-rilis, sementara model Tiongkok DeepSeek V4 Pro dan Kimi K2.6 beroperasi pada 50–100 token per detik melalui API komersial mereka.
Kapan Nvidia Nemotron 3 Ultra menjadi tersedia? Nemotron 3 Ultra tersedia mulai 4 Juni. Pengguna dapat mengakses model melalui API Nvidia atau penyedia cloud, dengan bobot publik dan resep pelatihan yang sedang dirilis.
Berita Terkait
Alphabet Mencari 80 Miliar Dolar AS untuk Mendanai Perluasan Infrastruktur AI
NVIDIA Bermitra dengan Unitree pada Desain Referensi Robot Humanoid H2+
Intel Menargetkan Nvidia dan AMD dengan Chip AI Baru
NVIDIA Meluncurkan Chip PC RTX Spark dan CPU Vera di COMPUTEX 2026
OpenAI Mengumumkan Peluncuran Divisi Robotika pada 1 Juni