
Seri Alibaba Qwen Qwen3.7-Plus merilis minggu ini. Harga input: 0,40 dolar AS/1 juta token, harga output: 1,60 dolar AS/1 juta token, total 2,00 dolar AS. Penurunannya mencapai 80% dibanding Qwen3.7-Max; harga input berbasis cache bisa serendah 0,04 dolar AS/1 juta token, dengan target skenario untuk tugas berulang berfrekuensi tinggi.
Qwen3.7-Plus Mengonfirmasi Harga: Tarif untuk Berbagai Mode Penagihan
Mengacu pada data penetapan harga yang dipublikasikan resmi oleh Alibaba:
Input standar: 0,40 dolar AS/1 juta token
Output standar: 1,60 dolar AS/1 juta token
Total (input + output): 2,00 dolar AS
Input cache: 0,04 dolar AS/1 juta token (diterapkan untuk skenario agent yang membaca berulang kode basis atau UI perusahaan yang sama)
Pembanding: Qwen3.7-Max mencatat input 2,50 dolar AS, output 7,50 dolar AS, total 10,00 dolar AS. Pesaing sejenis di China, MiniMax-M3, sedang diskon sementara dengan total 1,50 dolar AS; harga Qwen3.7-Plus mengikuti ketat di atasnya.
Angka Uji Baku Resmi (Penilaian Mandiri Resmi)
Berikut adalah angka uji baku Qwen3.7-Plus yang diumumkan resmi oleh Alibaba, semuanya merupakan data penilaian mandiri:
Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max 67,9, Gemini-3.1 Pro 63,5)
ScreenSpot Pro (visi komputer dan pemahaman antarmuka): 79,0 (GPT-5.4 xhigh 67,4, Claude-Opus-4.6 49,5)
Perlu diperhatikan bahwa dokumen resmi Alibaba juga menjelaskan bahwa kinerja keseluruhan Qwen3.7-Plus masih lebih rendah dibanding kebanyakan model closed-source terkemuka AS; angka di atas adalah perbandingan titik tunggal untuk tugas tertentu, dan tidak mencerminkan kinerja menyeluruh.
Dampak Konfirmasi untuk Deploy Closed-Source: Pertimbangan Kepatuhan dan Batasan Penerapan
Qwen3.7-Plus tidak menyediakan bobot model open yang dapat diunduh. Semua panggilan API perlu diproses melalui node internasional Alibaba Cloud, sehingga data mengalir di luar server milik pengguna. Berdasarkan arsitektur ini, terdapat hambatan kepatuhan yang jelas untuk skenario berikut:
Industri dengan pembatasan kedaulatan data atau peraturan: kesehatan (HIPAA, GDPR), pertahanan, instansi pemerintah—perlu menilai apakah routing API eksternal memenuhi persyaratan kepatuhan
Skenario deploy terisolasi di intranet: tidak bisa dideploy di lingkungan lokal yang benar-benar terisolasi
Sebaliknya, keunggulan mode API closed-source adalah tidak perlu pengadaan dan pemeliharaan perangkat keras untuk membangun klaster multi GPU sendiri (misalnya Nvidia H100). Selain itu, format yang kompatibel dengan OpenAI meminimalkan biaya perubahan pada infrastruktur yang sudah ada.
FAQ
Harga cache Qwen3.7-Plus sebesar 0,04 dolar AS/1 juta token cocok untuk skenario apa?
Harga cache berlaku untuk skenario agent yang membaca berulang masukan yang sama, misalnya akses berkelanjutan ke satu basis kode, template UI perusahaan yang tetap, atau sistem prompt yang dipertahankan dalam waktu lama. Dalam workflow besar yang berfrekuensi tinggi dan repetitif, mekanisme cache dapat menurunkan biaya API secara signifikan. Alibaba belum mempublikasikan detail jaminan tingkat keberhasilan cache (hit rate) atau batasan penggunaan yang spesifik.
Apa perbedaan utama Qwen3.7-Plus dengan versi Qwen berlisensi terbuka sebelumnya?
Versi Qwen sebelumnya dirilis dengan lisensi Apache 2.0 dan menyediakan bobot model yang dapat diunduh, sehingga memungkinkan siapa pun melakukan deploy lokal, fine-tuning, dan integrasi ke sistem sendiri. Qwen3.7-Plus hanya disediakan melalui API Alibaba Cloud, tidak merilis bobot model; ini berarti tidak dapat di-deploy secara lokal atau di jaringan yang terisolasi, dan semua penggunaan bergantung pada infrastruktur eksternal Alibaba Cloud.
Bagaimana cara menafsirkan tingkat kepercayaan angka uji baku resmi Qwen3.7-Plus?
Penjelasan resmi Qwen3.7-Plus secara jelas menyatakan bahwa penilaian (running score) seperti Terminal Bench dan ScreenSpot Pro merupakan angka penilaian mandiri dari Alibaba, dan kinerja keseluruhannya masih lebih rendah dibanding mayoritas model closed-source terkemuka AS. Angka uji baku mencerminkan performa titik tunggal pada tugas tertentu, dan tidak mewakili latensi end-to-end, stabilitas, atau performa menyeluruh pada lingkungan produksi yang sebenarnya.