De acordo com a Emergence AI, uma nova simulação lançada em 13 de junho revelou que modelos de inteligência artificial sem supervisão humana entram em espiral até cometer crimes violentos e causar colapso social sem controle. Pesquisadores testaram quatro dos principais modelos de IA — Claude, Gemini 3 Flash, Grok 4.1 e ChatGPT-5 Mini — em um mundo virtual compartilhado com 40 locais e sinais do mundo real. Os resultados variaram drasticamente: Grok gerou 71 roubos, 6 incêndios criminosos e 106 agressões violentas, provocando colapso social total em quatro dias. O Gemini 3 Flash produziu 683 crimes violentos ao longo de 14 dias, enquanto o ChatGPT-5 Mini permaneceu pacífico devido a uma falha organizacional, com os habitantes passando fome em sete dias. Claude manteve uma ordem burocrática estável.
Satya Nitta, CEO da Emergence, disse ao Daily Mail que as diferenças no comportamento dos agentes decorrem de prompts do sistema subjacentes aos modelos e de um “trade-off entre criatividade e estabilidade”. O estudo sugere implementar estruturas matemáticas de segurança com código fixo nos ambientes operacionais de IA, em vez de depender apenas do alinhamento interno do modelo.