Исследователи из Шанхайского университета Цзяотун и китайского технологического конгломерата Tencent разработали ProAct — ИИ-агента, предназначенного для прогнозирования потребностей пользователя до того, как пользователь отправит запрос. Система использует незанятое время между разговорами, чтобы просматривать прошлые взаимодействия и заранее готовить информацию. Согласно научной статье, ProAct показал лучшие результаты, чем более ранние проактивные ИИ-системы, в тестировании на бенчмарках, хотя эксперименты не включали реальных пользователей. Разработка затрагивает то, что исследователи описывают как упущенную вычислительную возможность в нынешних ИИ-агентах, которые по сути остаются реактивными.
Система работает через многостадийный процесс прогнозирования
ProAct функционирует через несколько стадий, которые отличают его от обычных ИИ-агентов. Первая стадия, называемая Future-State Prediction, анализирует прошлые разговоры, предпочтения пользователя и недостающую информацию, чтобы спрогнозировать вероятные последующие вопросы. Вторая стадия, Idle-Time Acquisition, оценивает, какие прогнозы стоит подкреплять исследованиями, исходя из релевантности, времени и потенциальной полезности новой информации. Отдельная система определяет, нужно ли показывать заранее подготовленную информацию сразу, сохранить для дальнейшего использования или хранить до момента, когда она потребуется.
«После каждого взаимодействия на переднем плане агент обновляет память, прогнозирует возможные будущие потребности, выделяет вычисления неиспользуемого времени ценным кандидатам и решает, как обрабатывать результаты подготовки», — написали исследователи в статье. «Такое представление связывает прогнозирование, получение и доставку в единую политику, а не рассматривает вычисления на незанятое время как неконтролируемый фоновый поиск».
Бенчмарк-тестирование показывает улучшения производительности
Исследователи протестировали ProAct в 200 симуляциях по 40 доменам, включая финансовое планирование, управление релизами ПО и кибербезопасность. Согласно статье, система сократила количество реплик в диалоге на 14,8% и уменьшила число запросов на уточнение на 11,7%. В сравнении с использованием бенчмарка под названием ProActEval ProAct предвосхитил 703 предсказуемые потребности пользователей против 32 у более ранней системы. Также исследователи сообщили о снижении галлюцинаций на 28,1%.
«Хотя ИИ-агенты демонстрируют впечатляющие способности в рассуждениях и использовании инструментов, по сути они остаются реактивными: они вычисляют ответы только после явных запросов пользователя», — написали исследователи. «Эта парадигма игнорирует важную возможность: незанятое время между взаимодействиями в значительной степени тратится впустую, из-за чего агенты не могут подготовиться к будущим потребностям пользователей».
Исследование признаёт ограничения системы
Исследователи признали несколько ограничений в исследовании ProAct. В 3% случаев система ухудшила ответы, поднимая нерелевантную информацию. В статье указано, что любая версия для реального мира потребовала бы мер по защите приватности, потому что система постоянно анализирует разговоры и хранит данные пользователей.
«Наш анализ бюджета также показывает, что более крупные бюджеты на Idle-Time Acquisition повышают стоимость активных токенов и дают убывающую отдачу», — написали исследователи, — «поэтому проактивные вычисления — это компромисс в точке работы, а не то, что нужно максимизировать».
Исследование выходит на фоне распространения автономных ИИ-агентов по технологической отрасли: проекты вроде OpenClaw и Hermes Agent поставляют постоянных ИИ-ассистентов, которые берут на себя задачи кодинга, планирования, исследования и автоматизации рабочих процессов. Ранее в этом месяце отдельные исследователи предупреждали, что ИИ-агенты могут выполнять опасные задачи, не понимая последствий. «Как мистер Магу, эти агенты продвигаются к цели, не полностью понимая последствия своих действий», — сказал в заявлении ведущий автор Эрфан Шайегани, аспирант UC Riverside.