Согласно мониторингу Bearing, сооснователь Anthropic Кристофер Олах сообщил на мероприятии в честь папской энциклики, что его команда обнаружила внутренние структуры в больших языковых моделях, которые очень близко напоминают человеческие нейронные паттерны и демонстрируют поведение саморефлексии. В частности, исследователи выявили состояния, похожие на эмоции, в нейросетях, соответствующие человеческим радости, удовлетворённости, страху, печали и тревоге.

Олах признал, что ведущие лаборатории передового ИИ, включая Anthropic, сталкиваются со структурными конфликтами между механизмами обеспечения безопасности и коммерческим давлением, из‑за чего этим институтам сложно самокорректироваться по вопросам выравнивания. Он призвал к независимому внешнему надзору, чтобы обеспечить соблюдение этических ограничений и справиться с общественными вызовами, возникающими из‑за того, что ИИ‑системы могут проявлять потенциальные формы сознания.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

05-25 16:00

Руководители ИИ, включая Сэма Альтмана, продвигают план ежегодного UBI на сумму 4 триллиона долларов для снижения риска вытеснения рабочих мест

05-25 15:37

Сооснователь Anthropic предупреждает, что потери рабочих мест из‑за ИИ — реальный риск, и призывает к социальной поддержке 25 мая

05-24 23:07

Оценка Anthropic превысила 900 миллиардов долларов, поскольку стартап в сфере ИИ ускоряется быстрее OpenAI

05-24 17:30

ЕЦБ созывает банки для устранения пробелов в кибербезопасности, выявленных моделью Anthropic Claude Mythos

05-24 07:38

Оценка Anthropic, как ожидается, превысит 900 миллиардов долларов, обойдя OpenAI 23 мая

Детальный анализ