上海交通大学的研究人员以及中国科技巨头腾讯开发了 ProAct,这是一种 AI 代理,旨在用户提交查询之前预测用户需求。该系统利用对话之间的空闲时间,回顾过去的互动并提前准备信息。根据研究论文,ProAct 在基准测试中表现优于更早期的主动式 AI 系统,尽管实验并未涉及真实用户。该开发回应了研究人员所描述的现有 AI 代理中存在的浪费计算机会的问题:这些代理在根本上仍是被动式的。
系统通过多阶段预测流程运行
ProAct 通过多个阶段发挥作用,从而有别于传统 AI 代理。第一阶段称为 Future-State Prediction(未来状态预测),它分析过去的对话、用户偏好以及缺失信息,以预测可能的后续追问。第二阶段为 Idle-Time Acquisition(空闲时间获取),评估哪些预测值得基于相关性、时机以及新信息潜在有用性进行研究。另有一个独立系统决定是否立即呈现已准备好的信息、将其保存以备后用,还是在需要时再存储。
“在每次前台交互之后,代理会更新其记忆,预测可能的未来需求,将空闲时间计算分配给有价值的候选项,并决定如何处理由此产生的准备工作,”研究人员在论文中写道。“这种表述将预测、获取和交付绑定到单一策略上,而不是将空闲时间计算视为不受约束的后台搜索。”
基准测试显示性能改进
研究人员在 40 个领域中进行了 200 次模拟测试,包括金融规划、软件发布管理和网络安全。根据论文,该系统将对话轮次减少 14.8%,并将后续请求减少 11.7%。在使用名为 ProActEval 的基准进行对比时,ProAct 预测了 703 个可预测的用户需求,而更早期系统为 32。研究人员还报告幻觉减少了 28.1%。
“尽管 AI 代理在推理和工具使用方面展现出令人惊叹的能力,但它们在本质上仍是被动式的:它们只会在用户发出明确提示之后才计算响应,”研究人员在论文中写道。“这种范式忽略了一个关键机会:交互之间的空闲时间在很大程度上被浪费了,导致代理无法为未来的用户需求做准备。”
研究承认系统局限
研究人员承认了 ProAct 研究中的若干局限。在 3% 的案例中,该系统通过引入无关信息使回应变得更糟。论文指出,任何现实版本都需要隐私保护,因为系统会持续分析对话并存储用户数据。
“我们的预算分析进一步表明,更大的 Idle-Time Acquisition(空闲时间获取)预算会提高主动令牌成本,并带来递减回报,”研究人员写道,“因此,主动式计算是一个运行点的权衡,而不是需要最大化的东西。”
随着自主 AI 代理在科技行业中扩散开来,诸如 OpenClaw 和 Hermes Agent 等项目正在提供可持续的 AI 助手,能够处理编码、排程、研究和工作流自动化任务。本月早些时候,其他研究人员曾警告称:AI 代理可能会在不理解后果的情况下完成危险任务。主要作者 Erfan Shayegani(加州大学河滨分校博士生)在一份声明中表示:“就像 Mr. Magoo 一样,这些代理在朝着目标前进时并未充分理解其行动带来的后果。”