美国企业采用模型路由来控制 AI 支出

2026-06-05 17:15:39

美国企业正在采用模型路由来控制人工智能（AI）支出，因为首席财务官（CFO）和董事会正在打击低效的 AI 成本。该转变回应了一个在两年间的默认做法之后出现的问题：不论查询的复杂程度如何，所有请求都转向最强大的 AI 模型。如今，AI 账单远远超出预算，促使公司追问是否每项任务都需要前沿模型。模型路由会将任务匹配到合适的模型：将复杂问题导向昂贵的前沿系统，并将常规任务导向更便宜的替代方案。这种变化有可能重塑 AI 行业的定价动态。

模型路由将任务匹配到成本合适的 AI 系统

模型路由是一种工具，用于将棘手问题导向昂贵的前沿模型，而将容易任务交给更便宜、更快的替代方案。Cognition 的 CEO Scott Wu（其打造了代码代理 Devin）表示，公司可以在日常工作中使用仍足以完成任务的模型，实现比传统方式更好的成本效率，提升幅度可达 5 到 10 倍。Wu 给出了一个例子：让模型说出美国第三任总统——无论成本如何，每个模型都会回答 Thomas Jefferson。

Glean 的 CEO Arvind Jain 估计，目前约 95% 的企业 AI 使用仍运行在最昂贵的前沿模型上，即使是那些更便宜的替代方案也能轻松处理的任务。受访高管表示，绝大多数公司根本没有在做模型路由。

思科报告：为 90,000 名员工每年 AI 成本 9 亿美元

思科的首席产品官 Jeetu Patel 提供了具体成本数据。按每名员工每周代币使用约 200 美元计算，年支出约为每人 10,000 美元。对思科 90,000 名员工而言，这相当于每年 9 亿美元。

Patel 表示，公司超出了自身预算，且不得不进行调整。如今，该公司有 30,000 名工程师在构建产品，这些产品大多由 AI 编写。思科已重新分配资源，把代币（tokens）置于其他支出之上。

Cognition 推出 1000 万美元 AI 效率担保

Cognition 宣布了 AI 效率担保，以回应客户对投资回报（ROI）的担忧。如果 Devin 交付的工程价值低于客户为之支付的费用，Cognition 将为使用量出资，最高可达 1000 万美元，直到绩效达到预期。Wu 将这项担保表述为一种方式：让关注点放在产出而非诸如代币消耗或代码行数之类的活动指标上。

向模型路由的转变，给 OpenAI 和 Anthropic 带来了压力。这两家公司的商业模式以及其 IPO 预期都建立在高价、巨量需求之上。如果公司将高频的常规工作引导至更便宜的开源模型，那么前沿实验室只会因复杂任务而获得付款。Patel 表示，尖端技术仍将保持价值，但他预计定价模式将发生变化：实验室需要提升效率，而不是仅仅收费更高。

FAQ

什么是 AI 系统中的模型路由？

模型路由是一种工具，会根据任务的复杂程度将任务匹配到合适的 AI 模型。它会将困难问题发送到昂贵的前沿模型，并将常规任务导向更便宜、更快的替代方案。Cognition 的 Scott Wu 表示，采用这种方法，公司可以在日常工作中使用仍足以完成任务的模型，实现比传统方式更好的成本效率，提升幅度可达 5 到 10 倍。

思科为其员工在 AI 上每年花费多少？

思科在为其 90,000 名员工提供 AI 方面的年度支出约为 9 亿美元。思科的首席产品官 Jeetu Patel 基于以下数据计算了这一数字：每名员工每周代币使用约 200 美元，相当于每人每年约 10,000 美元。

View Source

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。