据 Beating,OpenAI 在其 Realtime API 中发布了三个语音模型:用于带推理的语音对话的 GPT-Realtime-2、用于实时翻译的 GPT-Realtime-Translate,以及用于流式转录的 GPT-Realtime-Whisper。GPT-Realtime-2 是 OpenAI 首个具备 GPT-5 级推理能力的语音模型,将上下文窗口从 32K 扩展到 128K 个 token,并支持长达 1-2 小时的高密度对话。
与 GPT-Realtime-1.5 相比,GPT-Realtime-2 在 Big Bench Audio 基准上提升了 15.2%,在 Audio MultiChallenge 上提升了 13.8%。GPT-Realtime-Translate 支持 70+ 种输入语言,并翻译为 13 种输出语言。定价:GPT-Realtime-2 的输入为 $32/百万输入 token,输出为 $64/百万输出 token;Translate 为 $0.034/分钟;Whisper 为 $0.017/分钟。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
DeepMind AlphaEvolve 跨领域战绩:4×4 矩阵乘法刷新 Strassen 1969 纪录、Gemini 训练快 1%
Google DeepMind 5 月 7 日(美国时间)发布 AlphaEvolve 跨领域成果报告。DeepMind 官方博客整理 AlphaEvolve 自推出以来的具体进展:找到比 Strassen 1969 算法更好的 4×4 复数矩阵乘法方法(48 次纯量乘法)、与陶哲轩(Terence Tao)等数学家合作解决多个 Erdős(艾狄胥)数学难题、为 Google 数据中心节省 0.7% 全球运算资源、把 Gemini 训练的关键 kernel 速度提升 23%、整体 Gemini 训练时间减少 1%。
架构:Gemini Flash 广度探索 + Gemini
鏈新聞abmedia9 分钟前
OpenAI Codex 推出 Chrome 擴充:可在瀏覽器中測試 Web 应用程序、跨页面获取上下文、并行运行
OpenAI 于 5 月 7 日(美国时间)公布 Codex 的 Chrome 扩充功能,让 Codex 编码 Agent 可直接在 macOS 与 Windows 的 Chrome 浏览器内运行。OpenAI Codex 官方文件说明,该扩充功能使 Codex 在不接管用户浏览器的情况下,测试 web app、跨多个分頁获取 context、使用 Chrome DevTools,并与其他工作并行进行。OpenAI 同时公布 Codex 周活跃用户超过 400 万,较年初增长 8 倍。
浏览器内可做的事:测试 web app、跨页取 context、用 DevTools
Chrome 扩充功能
鏈新聞abmedia12 分钟前
OpenAI 推 GPT-Realtime-2:将 GPT-5 推理带入语音 Agent、context 升至 128K
OpenAI 5 月 7 日(美国时间)在开发者大会公布三款新的实时语音模型:GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper,全部通过 Realtime API 对开发者开放。OpenAI 官方公告说明、GPT-Realtime-2 是 OpenAI 第一个具备 GPT-5
鏈新聞abmedia13 分钟前
实地走访中国 AI 实验室:研究员揭「芯片与数据缺口」成中美差距关键
在对中国多家 AI 实验室进行深入走访时,Nathan Lambert 指出,中国的核心优势在于文化、人才与务实心态:研究以提升模型质量为先,学生成为核心贡献者,组织协作较少内斗;但在芯片、数据与创造力方面存在缺口,外部算力受到美国管制,且数据质量偏低,促使其自建训练环境。企业会开源但保留核心技术以自家微调。若美国进一步收紧开放生态,可能影响全球领先地位。
鏈新聞abmedia23 分钟前
A16z 领投 $16M 融资轮,瑞典 AI 创业公司 Pit
据彭博报道,瑞典 AI 初创公司 Pit 在一轮由 Andreessen Horowitz 领投的融资中筹集了 1600 万美元,Lakestar 以及多家大型 AI 和科技公司的高管参与其中。瑞典的 Stena 和 Lundin 家族也加入了该轮融资。Pit 已经与 Voi 签署了试点项目,
GateNews26 分钟前
白宫 AI 预审机制讨论曝光,Hassett 言论次日遭官方否认
白宮国家经濟委員会(NEC)主任 Kevin Hassett 於 5 月 7 日接受 Fox Business 採訪时说,川普政府正研议透过行政命令要求 AI 模型在公开发布前通过政府安全審查,並類比 FDA 对藥品的上市前審批流程。但據 Politico 於 5 月 8 日报道,白宮高級官員随后稱該言論「斷章取義」。
Market Whisper31 分钟前