Menurut pemantauan Beating, Cursor mengungkapkan sebuah trik pelatihan dari rangkaian model Composer: menggunakan model generasi sebelumnya untuk secara otomatis membangun lingkungan yang dapat dijalankan untuk pembelajaran penguatan (RL) generasi berikutnya. Saat melatih Composer 2, Cursor menggunakan Composer 1.5 untuk menyelesaikan pekerjaan ini, yang disebut sebagai autoinstall.
Pelatihan RL membutuhkan lingkungan kode yang dapat dijalankan. Jika lingkungan tidak terpasang dengan baik, model akan membuang token untuk memperbaiki bug, sehingga tidak belajar apa-apa; dalam kasus ekstrem, lingkungan sama sekali tidak bisa berjalan, dan seluruh daya komputasi pelatihan terbuang sia-sia. autoinstall menyelesaikan masalah ini dalam dua langkah: langkah pertama, satu agen membaca dokumentasi dan konfigurasi kode, lalu mengusulkan 10 perintah verifikasi beserta output yang diharapkan; langkah kedua, agen lain mengambil 3 dari perintah tersebut, mulai dari nol mengatur lingkungan sampai perintah berjalan lancar. Langkah kedua maksimal diulang 5 kali, jika semua gagal, lingkungan tersebut dibuang.
Dalam proses pengaturan lingkungan, agen secara aktif melengkapi dependensi yang hilang: memalsukan tabel database, membuat konfigurasi MinIO sebagai pengganti S3, menjalankan container Docker sebagai layanan sidecar, bahkan menghasilkan gambar placeholder. Blog ini menggunakan proyek blockchain celo-org/celo-monorepo sebagai contoh untuk menunjukkan seluruh proses, di mana setelah kegagalan pengaturan lingkungan di putaran pertama, putaran kedua secara mandiri membuat pengguna mock untuk melewati otentikasi, dan akhirnya pengujian berjalan lancar.
Composer 2 meraih skor 61,7% di Terminal-Bench (standar pengujian kemampuan pembangunan lingkungan model), lebih tinggi hampir 14 poin persentase dibandingkan Composer 1.5 yang mencapai 47,9%. Cursor menyatakan rencana ke depan agar versi lama Composer dapat terlibat lebih banyak dalam proses pelatihan, termasuk pra-pemrosesan data, manajemen jalannya, dan penyempurnaan arsitektur.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Uni Eropa Melarang Pornografi Deepfake yang Dihasilkan AI pada 7 Mei
Menurut Xinhua News Agency, pada 7 Mei anggota Parlemen Eropa dan negara anggota mencapai kesepakatan untuk melarang sistem kecerdasan buatan menghasilkan konten pornografi deepfake. Larangan ini akan dimasukkan ke dalam amandemen Undang-Undang Kecerdasan Buatan 2024. Parlemen Eropa
GateNews9menit yang lalu
Tether Rilis Model AI MedPsy Medis QVAC, Raih Skor 62,62 pada Versi 17B Parameter
Menurut Odaily, Tether AI Research Group merilis QVAC MedPsy, model AI medis yang dirancang untuk berjalan secara lokal di smartphone dan perangkat wearable tanpa ketergantungan pada cloud. Versi berjumlah 1,7 miliar parameter itu memperoleh skor 62,62 pada tujuh tolok ukur medis, melampaui MedGemma-1.5-4B milik Google dengan selisih 11,42 poin
GateNews29menit yang lalu
B.AI Meluncurkan Empat Model Baru Termasuk GPT-5.5 Instant dalam 48 Jam Setelah Rilis OpenAI
API B.AI telah meluncurkan empat model baru: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7, dan GLM-5.1. GPT-5.5 Instant menyelesaikan adaptasi dasar dan integrasi antarmuka dalam waktu 48 jam setelah perilisan OpenAI, sehingga memungkinkan akses tanpa penundaan ke
GateNews34menit yang lalu
Model AI Medis 1,7 miliar milik Tether Melampaui Pesaing yang 16x Lebih Besar Hari Ini
Menurut tim riset AI Tether, perusahaan hari ini meluncurkan model bahasa medis seri QVAC MedPsy yang dirancang untuk dijalankan secara lokal di smartphone dan perangkat wearable tanpa ketergantungan pada cloud. Versi dengan 1,7 miliar parameter mencetak 62,62 pada tujuh benchmark medis, melampaui Google MedGemma-4B
GateNews45menit yang lalu
Penilaian Pra-IPO Anthropic Mencapai 1,2 Triliun Dolar AS, Melampaui OpenAI sebesar 20%
Menurut Odaily, valuasi tersirat Anthropic di pasar pra-IPO berbasis blockchain mencapai 1,2 triliun dolar AS, melampaui OpenAI sekitar 20%. Jika perusahaan go public dengan valuasi ini, perusahaan itu akan menjadi perusahaan tercatat publik terbesar ke-11 secara global berdasarkan kapitalisasi pasar, di belakang Apple,
GateNews49menit yang lalu
Kenaikan Saham Korea Selatan Mengungguli Pasar Global di Tengah Booming AI
Pasar saham Korea Selatan mengalami kenaikan yang belum pernah terjadi sebelumnya, didorong oleh saham semikonduktor terkait kecerdasan buatan, dengan indeks KOSPI naik 78% tahun ini, melampaui semua pasar besar lainnya secara global, menurut data Financial Modeling Prep yang dikutip dalam analisis Axios.
CryptoFrontier58menit yang lalu