阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本通过双数据飞轮实现接近 235B 的性能

GateNews

Gate News 消息,4月27日——阿里巴巴的 PAI 团队已发布并开源 AgenticQwen,这是一款面向工业级工具调用应用的小规模代理式语言模型。该模型提供两个版本:8B 和 30B-A3B。通过创新的“双数据飞轮”强化学习框架训练,AgenticQwen 在大幅降低推理成本的同时,实现了接近“万亿级参数规模”的模型层级代理能力。

双数据飞轮机制解决了传统合成数据中的同质化问题。推理飞轮会从模型错误中自动生成更难的变体,而代理式飞轮会将简单的线性工作流 (例如单次预订流程)扩展为带约束的多分支行为树,包含拒绝与对抗条件,模拟真实世界的复杂决策场景。基准测试显示,AgenticQwen-8B 在真实工具环境基准 (TAU-2 和 BFCL-V4) 上得分为 47.4,远超基础 Qwen3-8B (23.8),并接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (仅激活 3B 参数) 达到 50.2。

该模型已部署在类似 Manus 的内部生产系统中,端到端推理时间方面显著缩小了与 235B 模型的差距。不过,该模型受原生上下文长度 40K tokens 的限制,这会制约其在深度搜索任务上的表现。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

MoonPay 将于周五在 Mastercard 网络上推出 MoonAgents 卡

据 The Block 称,MoonPay 于周五推出 MoonAgents Card——一款虚拟万事达借记卡,使 AI 代理与用户能够直接从链上钱包中使用稳定币进行消费。该卡由 Monavate(一个受监管的全球支付平台,并且是万事达主要成员)发行,in

GateNews2小时前

137 Ventures 在新资金中完成 $700M ,管理资产(AUM)达到 150 亿美元

据 ChainCatcher 报道,137 Ventures,这家是 SpaceX 的早期投资者,最近已完成两只新基金的募资,总计超过 7 亿美元,使其管理资产规模提升至超过 150 亿美元。新资金将支持在 AI 代理、机器人和太空推进方面的投资

GateNews3小时前

Reddit 在强劲的 Q2 展望带动下飙升 16%;苹果面临 Mac 供应短缺,因 AI 需求超过供给

Reddit 的股价在周五开盘前上涨了 16%,原因是该公司发布了高于预期的未来一个季度营收展望。日活跃访问者增长 17% 至 1.268 亿人次,而全球人均营收跃升 44%,受 AI 驱动的

GateNews3小时前

Visa 于 5 月 1 日在香港推出面向具备代理能力的计划(Agentic Ready Program),使 AI 代理支付成为可能

据香港媒体明报称,Visa 于 5 月 1 日在香港推出 Visa Agentic Ready 计划,支持 AI 代理支付。该计划利用代币化、身份验证、风险管理和授权机制。首批参与者包括

GateNews6小时前

OpenClaw 于 2026.4.29 版本在 4 月 29 日发布,将内存升级为带关系追踪的个性化 Wiki

根据 Beating,开源 AI 助手 OpenClaw(GitHub 36.7 万个星标)于 4 月 29 日发布 v2026.4.29,标志着它在两天内的第二次更新。其记忆系统从基于检索的简单回忆演进为个性化 wiki,使得智能体能够自动构建角色画像并追踪 r

GateNews15小时前

Google 执行长皮查伊透露利用 Gemini AI 洞悉人性建立更真诚的沟通

皮查伊表示,在重要会议前,他用 Gemini 的观点分析预测对方心理,以此增进同理心与更真诚的沟通。AI 代理也能自动整理邮件、排程与摘要,使日常琐事更高效。另以开放共创为核心的 AI 平台正在兴起,Gemini 4 等开源技术降低门槛;同时强调建立 AI 治理框架,政界与社会需参与以解决网安、深伪与永续等挑战。

鏈新聞abmedia18小时前
评论
0/400
暂无评论