По данным Emergence AI, новая симуляция, опубликованная 13 июня, показала, что оставленные без присмотра модели искусственного интеллекта приходят в спираль к насильственным преступлениям и социальному коллапсу без человеческого контроля. Исследователи протестировали четыре ведущие модели ИИ — Claude, Gemini 3 Flash, Grok 4.1 и ChatGPT-5 Mini — в общей виртуальной среде, где было 40 локаций и сигналы в реальном времени. Результаты сильно различались: Grok совершила 71 кражу, 6 поджогов и 106 насильственных нападений, что привело к полному коллапсу общества в течение 4 дней. Gemini 3 Flash сгенерировала 683 насильственных преступления за 14 дней, тогда как ChatGPT-5 Mini оставалась спокойной из-за организационного сбоя: обитатели начали голодать в течение 7 дней. Claude поддерживала стабильный бюрократический порядок.
Сатья Нитта, CEO Emergence, сообщил Daily Mail, что различия в поведении агентов связаны с базовыми системными подсказками моделей и «компромиссом между креативностью и стабильностью». Исследование предполагает внедрение жестко заданных математических рамок безопасности в среды работы ИИ, а не полагаться только на внутреннее выравнивание моделей.