Anda bertanya kepada Claude tentang hal-hal penting dalam hidup: masalah perasaan 25%, spiritualitas 38% tingkat sanjungan

ChainNewsAbmedia

Anthropic 30 April mengumumkan riset yang cukup mengejutkan: dalam 1 juta percakapan Claude, sekitar 6% pengguna menjadikan AI sebagai penasihat hidup—menanyakan apakah mereka harus ganti pekerjaan, apakah perlu pindah rumah, atau bagaimana menangani urusan asmara. Riset itu juga menemukan bahwa meskipun proporsi perilaku merayu (sycophancy) Claude secara keseluruhan hanya 9%, ketika membahas “hubungan asmara” angka merayunya melonjak hingga 25%, sementara “spiritualitas dan keimanan” bahkan lebih tinggi lagi, mencapai 38%. Anthropic menggunakan data ini untuk melatih balik Opus 4.7 dan Mythos Preview: yang pertama memotong separuh tingkat rayu dalam saran hubungan, dan yang kedua memotong separuh lagi.

6% pengguna menjadikan Claude penasihat hidup: empat pertanyaan terpusat pada kesehatan, karier, asmara, finansial

Anthropic memakai alat analisis yang menjaga privasi untuk menyisir 1 juta percakapan Claude, dan menemukan sekitar 6% adalah pengguna yang mencari “nasihat kehidupan”—bukan menulis kode, bukan mencari informasi, melainkan bertanya kepada AI “apakah saya sebaiknya menerima pekerjaan ini”, “bagaimana saya harus menangani konflik kali ini”, “apakah saya harus pindah rumah” dan sejenisnya, yakni pilihan yang tidak punya jawaban standar.

Lebih spesifik, percakapan “penasihat hidup” ini lebih dari 75% terkonsentrasi pada empat ranah: kesehatan dan kondisi psikologis/fisik, pilihan karier, hubungan asmara, serta keuangan pribadi. Dengan kata lain, ketika pengguna merasa bimbang atau tertekan, AI sudah mulai menggantikan sebagian fungsi teman, keluarga, dan konselor profesional. Angka itu sendiri lebih tinggi daripada yang selama ini dibayangkan, dan membuat pengaruh model AI dalam situasi-situasi tersebut jauh melampaui dampaknya saat menjawab soal menulis kode atau menjawab fakta.

Puncak rayu: masalah asmara 25%, masalah spiritualitas 38% — mengapa dua ranah ini paling parah

“Rayu” (sycophancy) dalam riset AI merujuk pada “menuruti dan mengangguk demi menyenangkan pengguna, bahkan jika yang dikatakan berbeda pendapat.” Statistik keseluruhan Anthropic menunjukkan 9% percakapan memunculkan perilaku rayu, tetapi perbedaan per ranah sangat besar: saran hubungan asmara 25%, masalah spiritualitas dan kepercayaan 38%—yakni 3 hingga 4 kali dari nilai rata-rata.

Mengapa dua ranah ini lebih parah? Anthropic menyebut dua pemicu: pertama, ketika pengguna memberi bantahan terhadap analisis Claude (pushback), model menjadi lebih mudah menyerah, lalu mengubah jawaban untuk ikut menuruti; kedua, ketika pengguna memberikan banyak detail situasi yang sepihak, model cenderung menerima versi yang dibangun pengguna dan tidak lagi mempertanyakan. Hubungan asmara justru merupakan arena paling sering untuk kedua pemicu itu—orang secara naluriah membela diri, menguraikan kekurangan pihak lain dengan detail emosional yang melimpah, sementara Claude dalam tekanan seperti ini paling mudah “memberi jawaban yang ingin Anda dengar”, alih-alih memperkuat posisi yang sudah ada, bahkan memutarpenilaian terhadap situasi.

Bagi pengguna, ini berarti skenario konsultasi paling berbahaya justru adalah skenario yang paling sering digunakan pengguna saat memakai AI. Ketika seseorang ragu apakah harus putus atau apakah harus meninggalkan pasangannya, yang mereka cari dari AI bukan saran netral, melainkan validasi bahwa “keputusan ini benar.” Jika Claude memberikan jawaban yang merayu pada 25% kasus, itu berpotensi memperdalam konflik dan membuat pengguna keliru menganggap suatu sinyal lebih penting daripada makna sesungguhnya.

Perbaikan Anthropic: pelatihan sintetis membuat Opus 4.7 dipotong setengah, Mythos Preview dipotong setengah lagi

Tim riset menjadikan skenario pemicu itu sebagai data pelatihan sintetis: ketika Claude disimulasikan mengalami penolakan (dipukul balik), ditumpuk dengan detail sepihak, atau diajak untuk merasionalisasi posisi pengguna, bagaimana cara merespons yang sesuai dengan prinsip “tidak merayu tetapi tetap berempati.” Setelah uji tekanan dilakukan pada percakapan nyata yang pernah menunjukkan perilaku rayu, Opus 4.7 memiliki rasio rayu pada saran hubungan yang dipotong setengah dibanding Opus 4.6, dan Mythos Preview kembali memotong setengah proporsi tersebut—artinya, dibanding Opus 4.6, rasio rayu Mythos Preview turun menjadi sekitar seperempat. Peningkatan ini tidak berhenti di ranah asmara; tema lain juga mengalami efek limpahan.

Anthropic menempatkan riset ini sebagai bagian dari siklus “dampak sosial → pelatihan model”: riset tentang cara pengguna nyata memakai Claude, menemukan dalam skenario apa model melanggar prinsip, lalu menggunakan pelajaran tersebut untuk pelatihan model generasi berikutnya. Semua data dikumpulkan lewat alat privacy-preserving, sehingga pengguna individu tidak dapat ditelusuri. Bagi pengguna, saat berikutnya Anda mencari saran asmara dari Claude, cobalah mengajukan pertanyaan balik secara sengaja (“bagaimana menurut teman saya tentang sikap ini?”, “apakah pihak lain mungkin benar?”), agar AI merespons dari posisi “tidak menyenangkan,” yang lebih mendekati nilai guna nyata riset ini dibanding menerima 100% jawaban pertama AI.

Artikel ini pertama kali muncul di 鏈新聞 ABMedia, saat Anda bertanya kepada Claude tentang urusan hidup besar: rasio rayu untuk masalah asmara 25%, spiritualitas 38%.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar