Gate News 消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型 KV 缓存实现多智能体系统间的高效记忆共享,在不损失准确率的前提下大幅降低 Token 消耗。在主流多智能体架构中,编排者(Orchestrator)将任务拆解并反复调用工作者(Worker)模型,随着推理链路不断延伸,Token 用量呈指数级膨胀。Latent Briefing 的核心思路是借助注意力机制识别上下文中真正关键的部分,在表示层直接丢弃冗余信息,而非依赖速度慢的 LLM 摘要或稳定性差的 RAG 检索。在 LongBench v2 基准测试中,该方法表现亮眼:Worker 模型 Token 消耗降低 65%,中等长度文档(32k 至 100k)的 Token 节省中位数达 49%,整体准确率较基线提升约 3 个百分点,而每次压缩的额外耗时仅约 1.7 秒,较原始算法提速约 20 倍。实验以 Claude Sonnet 4 作为编排者、Qwen3-14B 作为工作者模型,覆盖学术论文、法律文书、小说及政府报告等多类文档场景。研究还发现,最优压缩阈值因任务难度和文档长度而异——难题适合激进压缩以过滤投机性推理噪声,长文档则更适合轻度压缩以保留分散的关键信息。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
AI 自动售货代理“Valerie”使用 OpenClaw 在旧金山运营自动售货机
AI 代理“Valerie”现在在 OpenClaw 上运行一台旧金山自动售货机,测试人们会在多大程度上信任带有定价、营销以及现实世界现金的代码。
摘要
AI 代理“Valerie”使用 OpenClaw 框架在旧金山运行一台实体自动售货机,设定价格、命名
Cryptonews 5小时前
万事达通过与Lobstercash和Crossmint的合作实现AI代理支付
万事达与Lobstercash和Crossmint携手,通过现有的信用卡和借记卡来促成AI代理支付,并集成到现有金融系统中,无需新建钱包。该合作伙伴关系使AI能够自动化交易,从而提升效率与安全性。
GateNews10小时前
中国团队 EvoMap 怒控爆红 Hermes Agent 抄袭:自进化体系存在高度相似性
中国团队 EvoMap 指控 Nous Research 的 Hermes Agent 抄袭其 Evolver/GEP 架构,认为两者在多个关键模块上存在高度相似性。EvoMap 指出,Hermes 的设计未引用或致谢其先前公开的内容,争议引发社群广泛关注,部分中国网友声援 EvoMap,并批评 Hermes 的抄袭行为。尽管 Nous 研究团队尚未针对指控逐条反驳,但事件已迅速在 AI 舆论中扩散。
鏈新聞abmedia10小时前
OpenAI 更新 Codex:AI 代理可控制桌面,自动化开发工作流程
OpenAI 升级版 Codex 正在从编程助手演进为面向桌面环境的自主代理,能够管理应用、自动化工作流程,并与 100 多个应用集成。此转变增强了任务连续性与工作流自动化,反映出 AI 编程工具领域的竞争格局加剧。
GateNews11小时前
Agile Soda推出Agentic OCR平台,文档分类准确率达98%
Agile Soda推出了Agentic OCR,这是一款由AI驱动的文档自动化平台,可消除预训练需求并实现即时部署。它在分类和提取方面具备高精度,并通过用户修正持续改进,同时计划进行未来增强。
GateNews15小时前
美国运通将在 2026 年第二季度收购 AI 费用初创公司 Hyper
美国运通将收购 AI 初创公司 Hyper,以增强其面向商业客户的费用管理工具。此次收购预计将于 2026 年第二季度完成,该收购紧随其在 2024 年推出的联名奖励卡合作之后。
GateNews16小时前