谷歌研究发布 ReasoningBank:AI 智能体从成功与失败中学习推理策略

Gate 新闻消息,4月22日——谷歌研究发布了 ReasoningBank,这是一个智能体记忆框架,使基于大型语言模型的智能体能够在部署后持续学习。该框架从成功和失败的任务经验中提取通用推理策略,并将其存储在记忆库中,以便在未来相似任务中检索与执行。相关论文发表于 ICLR,代码已在 GitHub 上开源。

ReasoningBank 在两种现有方法的基础上进行了改进:Synapse 会记录完整的行动轨迹,但由于粒度较细,迁移能力有限;Agent Workflow Memory 只从成功案例中学习。ReasoningBank 做出了两项关键改变:存储“推理模式”而不是“行动序列”,并且每条记忆包含用于标题、描述和内容的结构化字段;将失败轨迹纳入学习。该框架使用一个模型对执行轨迹进行自我评估,将失败经验转化为反陷阱规则。例如,规则“看到就点击‘加载更多’按钮”会演化为“先验证当前页面标识符,避免陷入无限滚动循环,然后点击加载更多”。

论文还提出了 Memory-aware Test-time Scaling (MaTTS),它会在推理期间分配额外计算,用于探索多条轨迹并将发现存储到记忆库中。并行扩展会为同一任务运行多个不同的轨迹,通过自我对比来进一步完善更稳健的策略;串行扩展则会对单条轨迹进行迭代细化,并将中间推理存入记忆。

在使用 Gemini 2.5 Flash 作为 ReAct 智能体的 WebArena 浏览任务以及 SWE-Bench-Verified 编码任务中,ReasoningBank 相比没有记忆的基线,在 WebArena 上成功率提高了 8.3%,在 SWE-Bench-Verified 上提高了 4.6%,同时将每个任务的平均步骤数减少了约 3。将 MaTTS 与并行扩展结合((k=5))后,WebArena 的成功率还进一步提升了 3 个百分点,并且步骤数额外减少了 0.4。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Coinbase 工程师:AI 代理可能会颠覆网络广告模式

Coinbase 工程师 Erik Reppel 表示,人工智能代理可能从根本上动摇依赖互联网广告的商业模式。根据 Reppel 的说法,网络经济在很大程度上依赖于来自人类用户的广告收入,但 AI 代理会绕过该系统。

Crypto Frontier1 分钟前

Prophet 今日推出 AI 驱动的预测市场,并开设 10,000 美元的实时交易分档

据 MetaversePost 报道,Prophet 于今日(5 月 6 日)推出了一个由 AI 驱动的预测市场,分配了 10,000 美元的 USDC 用于实时交易。用户可以直接与一个生成基于概率定价的 AI 对手方进行交易;每个市场中有些合约将在 24 小时内结算。

GateNews6小时前

Tessera Labs 完成由 a16z 领投的 A 轮融资;6 人 AI 团队取代 60 名 SAP 顾问

据 Beating 称,Tessera Labs,这家 AI 系统集成公司,已完成由 a16z 领投的 A 轮融资。该初创公司成立于 2024 年,使用多智能体平台来自动化 SAP ECC 到 S/4HANA 的迁移,传统上这需要 3-5 年以及 1 亿美元到 5 亿美元每年。

GateNews6小时前

台指站稳四万点、美股再创新高,但 AI 产业才刚进入早期阶段?

高盛指出,AI 需求将因消费型 agent 工作负载大幅提升代币消耗,到 2030 年增长或将超过 12 倍,每月代币运算可达 60 兆;非 agent 与 consumer agent 的差别在于长时间自动化任务,若成真 AI 将进入 agentic 工作流程。Larry Fink 表示算力供给严重短缺,未来或将出现算力期货,两者共同支撑 AI 基础建设的多头论;文章认为 AI 仍处于早期阶段。

鏈新聞abmedia7小时前

WLFI 生態 AI 專案 WorldClaw 推出代理作业系统,未揭露品牌还能卖一万美元?

川普家族加密专案 World Liberty Financial(WLFI)再出新招,携手 WorldClaw 推出 AI 模型统一入口 WorldRouter,主打整合 300 款 AI 模型的代理人平台,最高付费方案要价近万美金,但附赠的却是一台「未披露品牌与作业系统」的硬件装置,引发外界疑虑。 @WorldClawAI 正在扩大 AI 的访问权限,$WLFI 在生态系统中扮演关键角色。用户可以通过 WorldRouter 访问 300+ 个模型,而代理人可以

鏈新聞abmedia10小时前

Meta 开发 AI 助理 Hatch 对标 OpenClaw,6 月底前完成内测

据《金融时报》于 5 月 5 日报道,Meta 正在开发一款面向普通消费者的 AI 助理(Hatch),灵感来自 OpenAI 旗下的 OpenClaw,目标是在 6 月底前完成内部测试;Meta 同时计划在今年第四季度前,将独立的代理型购物工具整合至旗下 Instagram 服务。

Market Whisper11小时前
评论
0/400
暂无评论