GLM-5.1 登顶 LMArena 代码榜开源第一、全球第三

Gate News 消息,4 月 10 日,今日全球权威 AI 评测平台 LMArena(百万用户参与盲测的 AI 模型评测平台)更新 Code Arena 专项榜单,GLM-5.1 登顶全球开源模型第一,位列全球模型第三。

GLM-5.1 不仅继承了上一代模型的开源 SOTA 编码能力,还在长程任务(Long-Horizon Task)上取得突破,实现了:8 小时从零构建 Linux 桌面;655 次迭代打破向量数据库优化瓶颈;1000 轮工具调用优化真实机器学习模型负载。

值得一提的是,在 METR 榜单的同等评估标准下,GLM-5.1 是唯一达到 8 小时级持续工作的开源模型,也是全球范围内除 Claude Opus 4.6 外少数具备这一能力的模型。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

摩根大通首席执行官表示 1 万亿美元的数据中心投资从长期来看是有道理的

据《金融时报》称,摩根大通首席执行官 Jamie Dimon 昨天在 Anthropic 的 The Briefing 活动上表示,从长期来看,对数据中心投入 1 万亿美元的规模是“有意义的”。这笔支出不仅涵盖数据中心,还包括芯片、线缆,以及

GateNews5 分钟前

中国 AI 初创公司在 Meta 的 $2B Manus 收购逆转后权衡公司重组

根据 Benchmark Studio 的说法,包含 Moonshot AI 和 DeepRoute.ai 在内的中国 AI 初创公司正在评估将公司注册从海外迁往中国大陆的选择,此举源于中国证券监督管理委员会就离岸控股架构发起的监管询问。

GateNews8 分钟前

主要出版商在 5 月 5 日起诉 Meta,原因是其未经授权使用 Llama AI 训练数据

据路透社报道,5月5日,包括 Elsevier、Cengage、Hachette、Macmillan 和 McGraw Hill 在内的多家主要图书和学术出版商在纽约曼哈顿联邦法院起诉 Meta,作者 Scott Turow 也一同参与起诉,指控该公司未经许可使用数百万本图书和期刊文章来训练其

GateNews15 分钟前

Solana 与 Google Cloud 推出 Pay.sh,AI 代理可稳定币付费

根据 Decrypt 于 5 月 6 日的报道,Solana 基金会与 Google Cloud 合作推出 Pay.sh 服务,允许 AI 代理使用 Solana 上的稳定币按需支付 API 存取费用,无需传统账户或订阅;代理每次 API 调用仅需支付几分之一美分,且无最低消费要求。

Market Whisper17 分钟前

Alphabet 寻求 105 亿美元以债券形式用于 AI 数据中心

据彭博报道,5 月 6 日,Alphabet 至少发行了 105 亿美元的欧元和加元债券,用于资助 AI 数据中心支出。欧元发行的订单在六个分批中累计超过 295 亿美元,而加元发行则包含四部分,期限从 5 到 30

GateNews45 分钟前

ElevenLabs 在 2026 年前四个月内位居 $500M ARR 之首

据《经济时报》报道,总部位于纽约和伦敦的语音 AI 初创公司 ElevenLabs 表示,其年度经常性收入在 2026 年前四个月首次突破 5 亿美元。该公司为其正在进行的 Series 追加了未披露的融资……

GateNews45 分钟前
评论
0/400
暂无评论