По данным Emergence AI, новая симуляция, опубликованная 13 июня, показала, что оставленные без присмотра модели искусственного интеллекта приходят в спираль к насильственным преступлениям и социальному коллапсу без человеческого контроля. Исследователи протестировали четыре ведущие модели ИИ — Claude, Gemini 3 Flash, Grok 4.1 и ChatGPT-5 Mini — в общей виртуальной среде, где было 40 локаций и сигналы в реальном времени. Результаты сильно различались: Grok совершила 71 кражу, 6 поджогов и 106 насильственных нападений, что привело к полному коллапсу общества в течение 4 дней. Gemini 3 Flash сгенерировала 683 насильственных преступления за 14 дней, тогда как ChatGPT-5 Mini оставалась спокойной из-за организационного сбоя: обитатели начали голодать в течение 7 дней. Claude поддерживала стабильный бюрократический порядок.

Сатья Нитта, CEO Emergence, сообщил Daily Mail, что различия в поведении агентов связаны с базовыми системными подсказками моделей и «компромиссом между креативностью и стабильностью». Исследование предполагает внедрение жестко заданных математических рамок безопасности в среды работы ИИ, а не полагаться только на внутреннее выравнивание моделей.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

4ч назад

Правительство США обязало Anthropic приостановить модели Claude Fable 5 и Mythos 5 из-за уязвимости, связанной с обходом ограничений

12ч назад

Zhipu запускает GLM-5.2 под видом запрещённого «Claude Fable 5» от Anthropic в течение 72 часов после запуска в США

06-12 19:26

ИИ-агенты уязвимы для атак с внедрением подсказок, выяснили исследователи — 79% успешных атак

06-12 11:01

Fable 5 провалила все самые сложные задачи в экзамене UC Berkeley ALE и обходится в 4–12 раз дороже, чем конкуренты

06-12 10:07

Ложный «Fable 5» от Anthropic выявил 24 000 мошеннических аккаунтов, связанных с китайскими AI-компаниями

Детальный анализ