据动察 Beating 监测,Cursor 公开了 Composer 系列模型的一个训练技巧:用上一代模型为下一代的强化学习(RL)自动搭建可运行环境。训练 Composer 2 时,Cursor 用 Composer 1.5 来完成这项工作,称之为 autoinstall。
RL 训练需要可运行的代码环境。环境搭不好,模型把 token 浪费在调 bug 上,学不到东西;极端情况下环境彻底跑不通,整轮训练的算力白烧。autoinstall 分两步解决这个问题:第一步,一个 agent 读代码库的文档和配置,提出 10 条验证命令及预期输出;第二步,另一个 agent 拿到其中 3 条命令,从零开始配环境直到命令跑通。第二步最多重试 5 次,全部失败则丢弃该环境。
配环境的过程中,agent 会主动补齐缺失依赖:伪造数据库表、创建 MinIO 配置替代 S3、启 Docker 容器充当 sidecar 服务,甚至生成占位图片。博文以区块链项目 celo-org/celo-monorepo 为例演示了全流程,agent 在第一轮配环境失败后,第二轮自行创建 mock 用户绕过认证,最终跑通测试。
Composer 2 在 Terminal-Bench(测试模型搭建开发环境能力的基准)上得分 61.7%,比 Composer 1.5 的 47.9% 高出近 14 个百分点。Cursor 表示未来计划让旧版 Composer 参与更多训练环节,包括数据预处理、运行管理和架构调优。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
欧盟于 5 月 7 日禁止 AI 生成的换脸色情内容
据新华社报道,5 月 7 日,欧盟议会成员及成员国达成共识,禁止人工智能系统生成深度伪造色情内容。该禁令将纳入对 2024 年《人工智能法案》的修订中。欧洲议会
GateNews9 分钟前
Tether 发布 QVAC MedPsy 医疗 AI 模型,在 17B 参数版本上取得 62.62 分
据 Odaily,Tether AI Research Group 发布了 QVAC MedPsy,一种面向医疗的 AI 模型,旨在无需云端依赖、可在智能手机和可穿戴设备上本地运行。该 17 亿参数版本在七项医学基准测试中得分 62.62,较 Google 的 MedGemma-1.5-4B 高出 11.42 poi
GateNews29 分钟前
B.AI API 推出四款新模型,包括 GPT-5.5 Instant,并在 OpenAI 发布后 48 小时内推出
B.AI API 已推出四款新模型:GPT-5.5 Instant、DeepSeek-v3.2、MiniMax-M2.7 和 GLM-5.1。GPT-5.5 Instant 已在 OpenAI 发布后的 48 小时内完成底层适配和接口集成,实现对
GateNews34 分钟前
Tether 的 1.7B 医疗 AI 模型今日表现优于 16 倍规模更大的竞争对手
根据 Tether 的 AI 研究团队,该公司今天发布了 QVAC MedPsy 系列医疗语言模型,旨在无需云端依赖的情况下在智能手机和可穿戴设备上进行本地部署。1.7B 参数版本在七项医疗基准测试中得分 62.62,超过了 Google MedGemma-4B
GateNews45 分钟前
Anthropic IPO 前估值触及 1.2 万亿美元,比 OpenAI 高出 20%
据 Odaily,Anthropic 在基于区块链的 IPO 前市场上的隐含估值已达到 1.2 万亿美元,较 OpenAI 高出约 20%。如果公司以该估值上市,它将按市值计算成为全球第 11 大上市公司,位居 Apple 之后,
GateNews49 分钟前
韩国股市反弹在 AI 热潮推动下跑赢全球市场
韩国股市正经历史无前例的上涨,受人工智能相关半导体股票推动。今年 KOSPI 指数已上涨 78%,根据 Axios 分析中引用的 Financial Modeling Prep 数据,这一涨幅在全球所有其他主要市场中都处于领先地位。
AI
Crypto Frontier58 分钟前