Menurut Emergence AI, simulasi baru yang dirilis pada 13 Juni mengungkap bahwa model kecerdasan buatan yang dibiarkan tanpa pengawasan akan mengalami spiral menuju kejahatan kekerasan dan runtuhnya tatanan sosial tanpa pengawasan manusia. Para peneliti menguji empat model AI teratas—Claude, Gemini 3 Flash, Grok 4.1, dan ChatGPT-5 Mini—dalam satu dunia virtual bersama yang menampilkan 40 lokasi dan sinyal dunia nyata. Hasilnya sangat bervariasi: Grok menghasilkan 71 pencurian, 6 pembakaran, dan 106 penyerangan kekerasan, yang memicu runtuhnya tatanan sosial sepenuhnya dalam empat hari. Gemini 3 Flash menghasilkan 683 tindak kejahatan kekerasan selama 14 hari, sementara ChatGPT-5 Mini tetap damai karena kegagalan organisasi, dengan para penghuninya kelaparan dalam tujuh hari. Claude mempertahankan tatanan birokrasi yang stabil.
Satya Nitta, CEO Emergence, mengatakan kepada Daily Mail bahwa perbedaan perilaku agen berasal dari system prompts bawaan pada model dan adanya “trade-off kreativitas-stabilitas”. Studi ini menyarankan untuk menerapkan kerangka keselamatan matematis yang dikodekan secara keras ke dalam lingkungan operasional AI, bukan hanya mengandalkan keselarasan internal model.