Nvidia Mengungkap Nemotron 3 Ultra di Computex, Menyusul Kimi K2.6 dari China dalam Peringkat Kecerdasan

Nvidia meluncurkan Nemotron 3 Ultra pada 1 Juni di Computex di Taipei, sebuah model AI open-weight dengan 550 miliar parameter yang menjadi rilis open AI terbesar perusahaan hingga saat ini. CEO Jensen Huang mengumumkan model tersebut dalam pidato keynote-nya, memposisikannya sebagai model open-weight AS dengan peringkat tertinggi pada benchmark kecerdasan. Rilis ini mengintensifkan persaingan di ruang AI open-weight, tempat model-model Tiongkok termasuk Kimi K2.6 dari Moonshot AI saat ini memimpin peringkat kecerdasan global meski Nvidia unggul dalam kecepatan.

Nemotron 3 Ultra Meraih Skor 48 pada Benchmark Intelligence Index

Artificial Analysis, yang berkolaborasi dengan Nvidia dalam penilaian sebelum rilis, menempatkan Nemotron 3 Ultra di skor 48 pada Intelligence Index miliknya. Benchmark gabungan ini mengakumulasi 10 evaluasi yang mencakup penalaran, pemrograman, pengetahuan umum, dan kinerja agentic. Skor tersebut menetapkan Nemotron 3 Ultra sebagai model open-weight AS peringkat teratas, melampaui Gemma 4 31B milik Google yang bernilai 39, Nemotron 3 Super milik Nvidia yang bernilai 36, serta gpt-oss-120b milik OpenAI yang bernilai 33.

Model ini menggunakan arsitektur mixture-of-experts dengan total 550 miliar parameter, namun hanya mengaktifkan 55 miliar pada setiap waktu. Desain ini menekan biaya operasional sekaligus mempertahankan performa pada tugas penalaran yang kompleks.

Model Menyajikan 300+ Token per Detik pada Endpoint Pra-Rilis

Nemotron 3 Ultra menghasilkan lebih dari 300 token output per detik pada endpoint DeepInfra pra-rilis, menurut pengujian Artificial Analysis. Model Tiongkok dalam kelas kecerdasan yang sama—DeepSeek V4 Pro dan Kimi K2.6—saat ini beroperasi pada 50–100 token per detik melalui API komersial mereka. Nvidia mengklaim model ini berjalan lima kali lebih cepat dibanding alternatif open-weight yang sebanding dengan biaya 30% lebih rendah.

Arsitekturnya memadukan layer Mamba-2, atensi Transformer standar, dan routing mixture-of-experts. Model mendukung jendela konteks 1 juta token dan menggabungkan multi-token prediction (MTP), yang menghasilkan beberapa token masa depan secara bersamaan, bukan berurutan.

Kimi K2.6 Memimpin Peringkat Open-Weight dengan Skor Kecerdasan 54

Kimi K2.6 milik Moonshot AI menempati posisi teratas di antara model open-weight dengan skor Intelligence Index 54, enam poin di atas Nemotron 3 Ultra. Diluncurkan pada April, Kimi K2.6 berada di peringkat keempat secara global di antara semua model AI, dengan selisih tiga poin dari flagship milik Anthropic, Google, dan OpenAI yang bernilai sama-sama 57.

Model open-source Tiongkok meningkatkan pangsa penggunaan model open global dari sekitar 1,2% pada akhir 2024 menjadi sekitar 30% pada akhir 2025, sebagaimana dilaporkan pada bulan Maret.

Keluarga Nemotron Mencakup Tiga Ukuran Model Sejak 2023

Nvidia merilis model pertama ber-merk Nemotron pada November 2023, dengan generasi ketiga diumumkan pada Desember 2025. Keluarga ini mencakup tiga ukuran: Nano untuk tugas ringan, Super untuk aplikasi enterprise kelas menengah, dan Ultra untuk beban kerja penalaran yang kompleks. Ketiganya menggunakan arsitektur hibrida yang menggabungkan layer Mamba-2, atensi Transformer, dan routing mixture-of-experts.

Nemotron 3 Super, yang dirilis pada Maret dengan 120 miliar parameter, meraih skor 36 pada Intelligence Index. Kenaikan 12 poin pada Nemotron 3 Ultra menandai kemajuan yang signifikan dalam lini produknya.

Nvidia Mengalokasikan 26 Miliar Dolar untuk Pengembangan AI Open-Weight

Nvidia mengungkapkan rencana lima tahun untuk membelanjakan 26 miliar dolar AS guna pengembangan AI open-weight. Perusahaan membentuk Nemotron Coalition pada Maret, sebuah kelompok yang berisi delapan lab AI termasuk Mistral AI dan Perplexity, untuk bersama-sama mengembangkan model open frontier di infrastruktur DGX Cloud. Nvidia mengumumkan bahwa pihaknya tengah mengerjakan Nemotron 4, generasi berikutnya dalam keluarga model tersebut.

Model Tersedia 4 Juni Melalui API Nvidia dan Penyedia Cloud

Nemotron 3 Ultra tersedia mulai 4 Juni. Bobot model dipublikasikan dan resep pelatihannya sedang dirilis. Pengguna dapat mengakses model melalui API Nvidia atau penyedia cloud tanpa memerlukan perangkat keras datacenter khusus.

FAQ

Berapa skor kecerdasan yang diraih Nvidia Nemotron 3 Ultra pada 1 Juni? Nemotron 3 Ultra meraih skor 48 pada Artificial Analysis Intelligence Index, menjadikannya model open-weight AS berperingkat tertinggi. Benchmark ini menggabungkan 10 evaluasi yang mencakup penalaran, pemrograman, pengetahuan umum, dan kinerja agentic.

Bagaimana perbandingan kecepatan Nemotron 3 Ultra dengan model Tiongkok? Nemotron 3 Ultra menyajikan lebih dari 300 token output per detik pada endpoint DeepInfra pra-rilis, sementara model Tiongkok DeepSeek V4 Pro dan Kimi K2.6 beroperasi pada 50–100 token per detik melalui API komersial mereka.

Kapan Nvidia Nemotron 3 Ultra menjadi tersedia? Nemotron 3 Ultra tersedia mulai 4 Juni. Pengguna dapat mengakses model melalui API Nvidia atau penyedia cloud, dengan bobot publik dan resep pelatihan yang sedang dirilis.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar