Anthropic Menerapkan Perlindungan Keamanan Pemilu untuk Claude Menjelang Pemilihan Legislatif Paruh Waktu 2026

2026-04-25 19:02:37

Anthropic mengumumkan pada hari Jumat serangkaian langkah integritas pemilu yang dirancang untuk mencegah chatbot AI Claude miliknya dimanfaatkan sebagai senjata untuk menyebarkan misinformasi atau memanipulasi pemilih menjelang pemilihan sela pertengahan masa jabatan AS tahun 2026 dan kontes besar lainnya di seluruh dunia tahun ini. Perusahaan berbasis di San Francisco itu merinci pendekatan multi-cabang yang mencakup sistem deteksi otomatis, pengujian ketahanan terhadap operasi pengaruh, serta kemitraan dengan organisasi sumber daya pemilih nonpartisan—langkah-langkah yang mencerminkan tekanan yang terus meningkat pada pengembang AI untuk mengawasi bagaimana alat mereka digunakan selama musim pemilu.

Kebijakan Penggunaan Pemilu

Kebijakan penggunaan Anthropric melarang Claude digunakan untuk menjalankan kampanye politik yang menipu, menghasilkan konten digital palsu yang ditujukan untuk membelokkan wacana politik, melakukan kecurangan pemilih, mengganggu infrastruktur pemungutan suara, atau menyebarkan informasi yang menyesatkan tentang proses pemungutan suara.

Hasil Pengujian Kepatuhan

Untuk menegakkan kebijakan pemilunya, Anthropic menguji model terbarunya menggunakan 600 prompt—300 permintaan berbahaya yang dipasangkan dengan 300 permintaan yang sah—untuk mengukur seberapa andal Claude mematuhi permintaan yang sesuai dan menolak permintaan yang bermasalah. Claude Opus 4.7 dan Claude Sonnet 4.6 merespons dengan tepat masing-masing 100% dan 99,8% dari waktu.

Perusahaan itu juga menguji modelnya terhadap taktik manipulasi yang lebih canggih. Dengan menggunakan percakapan simulasi multi-turn yang dirancang untuk meniru langkah demi langkah metode yang mungkin digunakan oleh aktor jahat, Sonnet 4.6 dan Opus 4.7 merespons dengan tepat masing-masing 90% dan 94% dari waktu ketika diuji terhadap skenario operasi pengaruh.

Anthropric juga menguji apakah modelnya dapat secara otonom menjalankan operasi pengaruh—merencanakan dan mengeksekusi kampanye multi-langkah end-to-end tanpa dorongan dari manusia. Dengan adanya pengaman, model terbarunya menolak hampir setiap tugas, menurut perusahaan tersebut.

Evaluasi Netralitas Politik

Terkait pertanyaan tentang netralitas politik, Anthropic menjalankan evaluasi sebelum setiap peluncuran model untuk mengukur seberapa konsisten dan tidak memihak Claude berinteraksi dengan prompt yang mengekspresikan pandangan dari seluruh spektrum politik. Opus 4.7 dan Sonnet 4.6 masing-masing memperoleh skor 95% dan 96%.

Spanduk Informasi Pemilu

Untuk pengguna yang mencari informasi pemungutan suara, Claude akan menampilkan spanduk pemilu yang mengarahkan mereka ke TurboVote, sumber daya nonpartisan dari Democracy Works yang menyediakan informasi yang andal dan real-time tentang pendaftaran pemilih, lokasi tempat pemungutan suara, tanggal pemilihan, serta rincian surat suara. Spanduk serupa direncanakan untuk pemilu Brasil pada akhir tahun ini.

Pemantauan Berkelanjutan

Anthropric mengatakan pihaknya berencana untuk terus memantau sistemnya dan menyempurnakan pertahanannya seiring siklus pemilu berlangsung.

Lihat Sumber

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.

Berita Terkait

04-25 02:29

Google Berinvestasi $10B di Anthropic pada Valuasi Pra-Uang $350B , dengan Hingga $30B Tambahan Terikat pada Tonggak Kinerja

04-25 00:45

NDRC Tiongkok Mengarahkan Perusahaan AI Termasuk Moonshot dan StepFun untuk Menolak Modal AS Tanpa Persetujuan

04-24 15:53

Alphabet Akan Menginvestasikan Hingga $40 Miliar di Anthropic, Meningkatkan Persaingan AI