Harga Al i Qwen3.7-Plus dipotong 80%, dengan imbalan berbayar dalam bentuk sumber tertutup demi biaya yang lebih rendah

2026-06-03 05:14:01

Seri Alibaba Qwen Qwen3.7-Plus merilis minggu ini. Harga input: 0,40 dolar AS/1 juta token, harga output: 1,60 dolar AS/1 juta token, total 2,00 dolar AS. Penurunannya mencapai 80% dibanding Qwen3.7-Max; harga input berbasis cache bisa serendah 0,04 dolar AS/1 juta token, dengan target skenario untuk tugas berulang berfrekuensi tinggi.

Qwen3.7-Plus Mengonfirmasi Harga: Tarif untuk Berbagai Mode Penagihan

Mengacu pada data penetapan harga yang dipublikasikan resmi oleh Alibaba:

Input standar: 0,40 dolar AS/1 juta token

Output standar: 1,60 dolar AS/1 juta token

Total (input + output): 2,00 dolar AS

Input cache: 0,04 dolar AS/1 juta token (diterapkan untuk skenario agent yang membaca berulang kode basis atau UI perusahaan yang sama)

Pembanding: Qwen3.7-Max mencatat input 2,50 dolar AS, output 7,50 dolar AS, total 10,00 dolar AS. Pesaing sejenis di China, MiniMax-M3, sedang diskon sementara dengan total 1,50 dolar AS; harga Qwen3.7-Plus mengikuti ketat di atasnya.

Angka Uji Baku Resmi (Penilaian Mandiri Resmi)

Berikut adalah angka uji baku Qwen3.7-Plus yang diumumkan resmi oleh Alibaba, semuanya merupakan data penilaian mandiri:

Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max 67,9, Gemini-3.1 Pro 63,5)

ScreenSpot Pro (visi komputer dan pemahaman antarmuka): 79,0 (GPT-5.4 xhigh 67,4, Claude-Opus-4.6 49,5)

Perlu diperhatikan bahwa dokumen resmi Alibaba juga menjelaskan bahwa kinerja keseluruhan Qwen3.7-Plus masih lebih rendah dibanding kebanyakan model closed-source terkemuka AS; angka di atas adalah perbandingan titik tunggal untuk tugas tertentu, dan tidak mencerminkan kinerja menyeluruh.

Dampak Konfirmasi untuk Deploy Closed-Source: Pertimbangan Kepatuhan dan Batasan Penerapan

Qwen3.7-Plus tidak menyediakan bobot model open yang dapat diunduh. Semua panggilan API perlu diproses melalui node internasional Alibaba Cloud, sehingga data mengalir di luar server milik pengguna. Berdasarkan arsitektur ini, terdapat hambatan kepatuhan yang jelas untuk skenario berikut:

Industri dengan pembatasan kedaulatan data atau peraturan: kesehatan (HIPAA, GDPR), pertahanan, instansi pemerintah—perlu menilai apakah routing API eksternal memenuhi persyaratan kepatuhan

Skenario deploy terisolasi di intranet: tidak bisa dideploy di lingkungan lokal yang benar-benar terisolasi

Sebaliknya, keunggulan mode API closed-source adalah tidak perlu pengadaan dan pemeliharaan perangkat keras untuk membangun klaster multi GPU sendiri (misalnya Nvidia H100). Selain itu, format yang kompatibel dengan OpenAI meminimalkan biaya perubahan pada infrastruktur yang sudah ada.

FAQ

Harga cache Qwen3.7-Plus sebesar 0,04 dolar AS/1 juta token cocok untuk skenario apa?

Harga cache berlaku untuk skenario agent yang membaca berulang masukan yang sama, misalnya akses berkelanjutan ke satu basis kode, template UI perusahaan yang tetap, atau sistem prompt yang dipertahankan dalam waktu lama. Dalam workflow besar yang berfrekuensi tinggi dan repetitif, mekanisme cache dapat menurunkan biaya API secara signifikan. Alibaba belum mempublikasikan detail jaminan tingkat keberhasilan cache (hit rate) atau batasan penggunaan yang spesifik.

Apa perbedaan utama Qwen3.7-Plus dengan versi Qwen berlisensi terbuka sebelumnya?

Versi Qwen sebelumnya dirilis dengan lisensi Apache 2.0 dan menyediakan bobot model yang dapat diunduh, sehingga memungkinkan siapa pun melakukan deploy lokal, fine-tuning, dan integrasi ke sistem sendiri. Qwen3.7-Plus hanya disediakan melalui API Alibaba Cloud, tidak merilis bobot model; ini berarti tidak dapat di-deploy secara lokal atau di jaringan yang terisolasi, dan semua penggunaan bergantung pada infrastruktur eksternal Alibaba Cloud.

Bagaimana cara menafsirkan tingkat kepercayaan angka uji baku resmi Qwen3.7-Plus?

Penjelasan resmi Qwen3.7-Plus secara jelas menyatakan bahwa penilaian (running score) seperti Terminal Bench dan ScreenSpot Pro merupakan angka penilaian mandiri dari Alibaba, dan kinerja keseluruhannya masih lebih rendah dibanding mayoritas model closed-source terkemuka AS. Angka uji baku mencerminkan performa titik tunggal pada tugas tertentu, dan tidak mewakili latensi end-to-end, stabilitas, atau performa menyeluruh pada lingkungan produksi yang sebenarnya.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.

Berita Terkait

06-03 03:22

NAWS（NAWS.AI）naik 35,31% dalam 24 jam

06-02 08:13

Tencent Cloud Memangkas Harga Model DeepSeek-V4 hingga 97,5% Mulai 3 Juni

06-02 00:57

Alibaba Meluncurkan Model Agen AI Multimodal Qwen3.7-Plus dengan Akses API Komersial