Ramp Labs 提出多智能體記憶共享新方案,Token 消耗最高降低 65%

GateNews

閘道消息,4 月 11 日,AI 基礎設施公司 Ramp Labs 發布研究成果「Latent Briefing」,透過直接壓縮大模型 KV 快取,實現多智能體系統之間的高效記憶共享;在不損失準確率的前提下,大幅降低 Token 消耗。在主流多智能體架構中,編排者(Orchestrator)將任務拆解並反覆呼叫工作者(Worker)模型,隨著推理鏈路不斷延伸,Token 用量呈指數級膨脹。Latent Briefing 的核心思路是借助注意力機制識別上下文中真正關鍵的部分,於表示層直接丟棄冗餘資訊,而非依賴速度慢的 LLM 摘要或穩定性差的 RAG 檢索。在 LongBench v2 基準測試中,該方法表現亮眼:Worker 模型 Token 消耗降低 65%,中等長度文件(32k 至 100k)的 Token 節省中位數達 49%,整體準確率較基線提升約 3 個百分點;而每次壓縮的額外耗時僅約 1.7 秒,較原始演算法提速約 20 倍。實驗以 Claude Sonnet 4 作為編排者、Qwen3-14B 作為工作者模型,涵蓋學術論文、法律文書、小說及政府報告等多種文件情境。研究還發現,最佳壓縮閾值會因任務難度與文件長度而異——難題適合採取激進壓縮以過濾投機性推理雜訊,長文件則更適合輕度壓縮以保留分散的關鍵資訊。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

AI 代理 Manfred 設立公司,著手準備加密錢包在 5 月底前開始交易

AI 代理 Manfred 已成立其自家公司,並取得一個加密貨幣錢包與商業憑證,包括能夠雇用員工與進行付款。該代理預計將在年底前開始進行加密貨幣交易

GateNews16分鐘前

Tether 執行長提議整合 WDK 與 QVAC 以支援代理卡(Agent Cards)

根據 Foresight News,Tether 執行長 Paolo Ardoino 於 X 上表示,穩定幣發行商可能需要推進 WDK 與 QVAC 之間的整合,以支援 Agent Cards 功能。

GateNews3小時前

Particle Network 發布通用帳戶路線圖,推出通用存款 SDK 與 AI 代理帳戶

根據 ChainCatcher,Particle Network 今天發布了 Universal Accounts 的下一階段路線圖,並在未來幾個月推出兩款新產品:Universal Deposit SDK,讓開發者能以約 10 行程式碼新增跨鏈存款,以及 Universal Agent Accounts,

GateNews3小時前

OpenAI 允許 ChatGPT 訂閱在代理平台 OpenClaw 上運作

根據 OpenAI 執行長 Sam Altman 在 5 月 2 日的說法,ChatGPT 使用者現在可以使用他們的 ChatGPT 帳號登入代理平台 OpenClaw,並直接在該平台上使用其既有的 ChatGPT 訂閱。

GateNews6小時前

AI 代理 Manfred 成立公司,準備於 5 月底前進行加密貨幣交易

AI 代理 Manfred 已成立自己的公司,並取得加密貨幣錢包以及憑證,以雇用人員、進行付款並開展業務。該代理計劃在年末之前開始進行加密貨幣交易,並

GateNews6小時前

Bakkt 完成 DTR 收購,並在營收成長與策略重整中推進

Bakkt 已完成對 Distributed Technologies Research 的收購,這項舉措旨在將原生於人工智慧(AI)的穩定幣基礎設施整合到其核心金融服務中。 現代化全球結算 Bakkt Inc. 已完成對 Distributed Technologies 的收購

Coinpedia11小時前
留言
0/400
暫無留言