Tinygrad 报告称 GLM 5.2 在双 Blackwell 配置上实现 120 tokens/秒,投入 15 万美元

据 BlockBeats 称,6 月 21 日,Tinygrad 报告称,GLM 5.2 在双网络的 Blackwell 架构 tinybox 配置上实现了每秒 120 tokens 的推理速度。15 万美元的配置可选两台标准 tinybox 设备或一台 tinybox Pro。Tinygrad 将该方案定位为面向云端推理服务的私有部署替代方案,并配有标语“buy once, never pay cloud fees again.”。GLM 尚未正式确认这些性能说法。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论