Cartesia 推出 Sonic-3.5 TTS 和 Ink-2 STT 模型,用于实时语音 AI

S-1.25%
SONIC-1.77%
根据 Beating,AI 语音初创公司 Cartesia 宣布推出 Sonic-3.5 和 Ink-2,形成统一的实时语音代理技术栈。Sonic-3.5 负责文本到语音,首词延迟为 90 毫秒,并支持 42 种语言。Ink-2 提供语音到文本,词错误率为 3.6%,并基于语义理解进行原生的轮次检测,而不仅仅依赖静音时长。两种模型通过单一 API 集成,并采用双向流式传输以尽量减少传输延迟。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论