Google Gemini 3.1 Flash-Lite 正式上线:输入价格比 Claude 4.5 Haiku 便宜 75%,GPQA 得分 86.9%

据 Beating 称,Google Gemini 3.1 Flash-Lite 于 5 月 8 日从预览转为正式可用(GA),成为 Gemini 3 系列中最便宜、最快的模型。输入定价为每百万 tokens 0.25 美元,输出为每百万 tokens 1.50 美元——输入成本比 Claude 4.5 Haiku(1.00 美元)低 75%,输出成本比其低 70%(5.00 美元)。该模型具备 100 万 token 的上下文窗口,并实现 363 tokens/秒的吞吐量,比其前身 Gemini 2.5 Flash 快 45%。

性能基准显示,GPQA Diamond(研究生级别的科学推理)达到 86.9%,超越 Claude 4.5 Haiku 的 73.0% 以及 GPT-5 mini 的 82.3%。MMMU-Pro(多模态推理)达到 76.8%。早期采用者包括客服平台 Gladly,该平台称在生产工作负载中实现 60% 的成本降低和 99.6% 的成功率,以及 JetBrains,将 Flash-Lite 集成到 IDE 辅助工具中。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论