据 BlockBeats 报道,Coinbase 首席执行官 Brian Armstrong 于 6 月 27 日表示,在代币使用量呈指数增长的同时保持 AI 成本稳定的关键不是限制使用,而是使用更好的默认模型和缓存机制。Coinbase 通过其 LLM 网关默认使用 GLM 5.2 和 Kimi 2.7 等开放权重模型,同时仍鼓励工程师为特定任务选择合适的模型。该公司指出,91% 的员工从未达到使用上限,因此与其降低配额,不如转向成本更低的默认模型。
Coinbase 实施了基于缓存命中率的缓存感知请求处理和智能模型路由。例如,在优化缓存实现后,LibreChat 的缓存命中率从 5% 提升至 60%。通过这些实践,Coinbase 在代币使用量持续增长的同时,将 AI 支出削减了近一半。