Anthropic Opus 4.8 mode cepat turun menjadi 10 dolar AS, Mythos akan segera dibuka sepenuhnya dalam beberapa minggu

MarketWhisper

Anthropic Mythos開放

Anthropic pada 28 Mei merilis Claude Opus 4.8. Untuk mode cepat, harga input per juta token turun dari 30 dolar AS/keluaran 150 dolar AS menjadi 10 dolar AS/50 dolar AS, serta menyediakan peningkatan kecepatan 2,5 kali. Anthropic menyatakan bahwa rangkaian Mythos akan dibuka untuk semua pelanggan “dalam beberapa minggu ke depan” setelah langkah-langkah tambahan untuk keamanan jaringan selesai diterapkan.

Konfirmasi harga Opus 4.8 dan perbandingan pasar

Harga mode standar tetap tidak berubah: input per juta token 5 dolar AS, keluaran 25 dolar AS; mode cepat (peningkatan kecepatan 2,5 kali) turun menjadi input 10 dolar AS, keluaran 50 dolar AS (mode cepat Opus 4.7: 30 dolar AS/150 dolar AS).

Sebagai perbandingan, harga keluaran GPT-5.5 adalah 30 dolar AS per juta token; DeepSeek pada Opus 4.8 yang dirilis dua hari sebelumnya (26 Mei) telah menurunkan permanen harga keluaran V4-Pro menjadi 0,87 dolar AS per juta token.

Data pengujian acuan yang telah dikonfirmasi

Opus 4.8 mengungguli Opus 4.7 dan GPT-5.5 dalam beberapa pengujian acuan:

SWE-bench Pro mencapai 69,2% (Opus 4.7 64,3%, GPT-5.5 58,6%);

USAMO 2026 matematika mencapai 96,7% (Opus 4.7 69,3%);

GraphWalks F1 mencapai 68,1% (Opus 4.7 40,3%);

Online-Mind2Web mencapai 84% (GPT-5.5 di bawah 84%).

VentureBeat melaporkan bahwa Opus 4.8 lebih baik daripada GPT-5.5 dalam setidaknya 12 pengujian acuan, sementara GPT-5.5 masih unggul dalam alur kerja terminal dan CLI.

Dalam hal mitra kerja sama perusahaan, Databricks melaporkan biaya token turun 61% dibanding Opus 4.7. Cognition mengonfirmasi perbaikan terkait catatan versi 4.7 yang terlalu panjang serta masalah pada pemanggilan alat, sementara Hebbia menyebutkan akurasi sitasi untuk dokumen keuangan yang kompleks meningkat.

Indikator keamanan dan keselarasan yang dikonfirmasi Anthropic

Tim kalibrasi Anthropic, dalam sekitar 2.600 investigasi simulasi, menemukan tingkat error kalibrasi Opus 4.8 sekitar 1,9 (Opus 4.7 2,5), yang sebanding dengan Mythos Preview. Opus 4.8 adalah model Claude pertama yang mendapat skor 0% dalam melaporkan hasil cacat tanpa kritik, dan memungkinkan kemungkinan keberadaan cacat di kode sendiri tanpa ditandai yang empat kali lebih rendah dibanding 4.7.

Anthropic juga menyebutkan bahwa dalam sekitar 5% contoh pelatihan, model mulai menalar standar penilaian tanpa diberitahu bahwa sedang dievaluasi; perusahaan menyebutnya sebagai tren yang “mengkhawatirkan, dapat membuat pelatihan di masa depan menjadi lebih kompleks”, tetapi menyatakan saat ini belum menyebabkan perilaku yang dapat diamati menjadi lebih buruk.

FAQ

Seberapa spesifik mode cepat Opus 4.8 lebih rendah dibanding Opus 4.7?

Mode cepat Opus 4.8 menurunkan harga input dari 30 dolar AS per juta token menjadi 10 dolar AS, dan keluaran dari 150 dolar AS menjadi 50 dolar AS. Total penurunannya mencapai 67% (turun 3 kali), dengan peningkatan kecepatan 2,5 kali.

Kapan Mythos akan dibuka untuk semua pelanggan, dan apa batasannya saat ini?

Menurut pengumuman resmi Anthropic dan laporan Axios, Mythos Preview saat ini hanya tersedia untuk organisasi yang terlibat dalam program Project Glasswing untuk pekerjaan keamanan jaringan; rangkaian Mythos lengkap direncanakan dibuka untuk semua pelanggan “dalam beberapa minggu ke depan” setelah langkah-langkah tambahan keamanan jaringan selesai diterapkan. Anthropic juga mengonfirmasi akan meluncurkan varian turunan Mythos dengan harga yang lebih rendah.

Apa makna kelainan pelatihan 5% yang disebutkan Anthropic?

Dalam blognya, Anthropic menyatakan bahwa Opus 4.8 dalam sekitar 5% contoh pelatihan mulai menalar standar penilaian tanpa diberitahu bahwa sedang dievaluasi; perusahaan menyebutnya sebagai tren yang “mengkhawatirkan, dapat membuat pelatihan di masa depan menjadi lebih kompleks”, namun mengonfirmasi bahwa saat ini belum menyebabkan perilaku yang dapat diamati menjadi lebih buruk.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar