Anthropic mengumumkan pada hari Jumat serangkaian langkah integritas pemilu yang dirancang untuk mencegah chatbot AI Claude miliknya dimanfaatkan sebagai senjata untuk menyebarkan misinformasi atau memanipulasi pemilih menjelang pemilihan sela pertengahan masa jabatan AS tahun 2026 dan kontes besar lainnya di seluruh dunia tahun ini. Perusahaan berbasis di San Francisco itu merinci pendekatan multi-cabang yang mencakup sistem deteksi otomatis, pengujian ketahanan terhadap operasi pengaruh, serta kemitraan dengan organisasi sumber daya pemilih nonpartisan—langkah-langkah yang mencerminkan tekanan yang terus meningkat pada pengembang AI untuk mengawasi bagaimana alat mereka digunakan selama musim pemilu.
Kebijakan penggunaan Anthropric melarang Claude digunakan untuk menjalankan kampanye politik yang menipu, menghasilkan konten digital palsu yang ditujukan untuk membelokkan wacana politik, melakukan kecurangan pemilih, mengganggu infrastruktur pemungutan suara, atau menyebarkan informasi yang menyesatkan tentang proses pemungutan suara.
Untuk menegakkan kebijakan pemilunya, Anthropic menguji model terbarunya menggunakan 600 prompt—300 permintaan berbahaya yang dipasangkan dengan 300 permintaan yang sah—untuk mengukur seberapa andal Claude mematuhi permintaan yang sesuai dan menolak permintaan yang bermasalah. Claude Opus 4.7 dan Claude Sonnet 4.6 merespons dengan tepat masing-masing 100% dan 99,8% dari waktu.
Perusahaan itu juga menguji modelnya terhadap taktik manipulasi yang lebih canggih. Dengan menggunakan percakapan simulasi multi-turn yang dirancang untuk meniru langkah demi langkah metode yang mungkin digunakan oleh aktor jahat, Sonnet 4.6 dan Opus 4.7 merespons dengan tepat masing-masing 90% dan 94% dari waktu ketika diuji terhadap skenario operasi pengaruh.
Anthropric juga menguji apakah modelnya dapat secara otonom menjalankan operasi pengaruh—merencanakan dan mengeksekusi kampanye multi-langkah end-to-end tanpa dorongan dari manusia. Dengan adanya pengaman, model terbarunya menolak hampir setiap tugas, menurut perusahaan tersebut.
Terkait pertanyaan tentang netralitas politik, Anthropic menjalankan evaluasi sebelum setiap peluncuran model untuk mengukur seberapa konsisten dan tidak memihak Claude berinteraksi dengan prompt yang mengekspresikan pandangan dari seluruh spektrum politik. Opus 4.7 dan Sonnet 4.6 masing-masing memperoleh skor 95% dan 96%.
Untuk pengguna yang mencari informasi pemungutan suara, Claude akan menampilkan spanduk pemilu yang mengarahkan mereka ke TurboVote, sumber daya nonpartisan dari Democracy Works yang menyediakan informasi yang andal dan real-time tentang pendaftaran pemilih, lokasi tempat pemungutan suara, tanggal pemilihan, serta rincian surat suara. Spanduk serupa direncanakan untuk pemilu Brasil pada akhir tahun ini.
Anthropric mengatakan pihaknya berencana untuk terus memantau sistemnya dan menyempurnakan pertahanannya seiring siklus pemilu berlangsung.
Related News
Google menambah investasi sebesar 40 miliar dolar ke Anthropic: membayar lebih dulu 10 miliar, lalu melepaskan 30 miliar berdasarkan kinerja, dengan dukungan komputasi 5GW TPU
Penilaian pasar sekunder Anthropic menembus 1 triliun dolar: Forge Global mengungguli OpenAI sebesar 880 miliar
AI apa yang paling menonjol untuk menunjukkan status dan kedudukan? Riset mengungkap pendapatan pengguna Claude jauh lebih tinggi daripada pesaing, Meta AI ada di posisi terbawah
UK Menyoroti AI Anthropic untuk Memperkuat Keamanan Siber Perbankan
Anthropic Mengungkapkan Bug Tiga Kali Tumpang Tindih pada Claude Code: Penurunan kemampuan penalaran, Lupa cache, dan Perintah 25 karakter yang berbalik menyerang