Cartesia 推出 Sonic-3.5 TTS 與 Ink-2 STT 模型,提供即時語音 AI

S-3.99%
SONIC-0.39%
根據 Beating,AI 語音新創 Cartesia 宣布推出 Sonic-3.5 與 Ink-2,組成統一的即時語音代理技術堆疊。Sonic-3.5 負責文字轉語音,首個 token 延遲為 90 毫秒,並支援 42 種語言。Ink-2 提供語音轉文字,詞錯誤率為 3.6%,且基於語意理解進行原生的輪次偵測,而非僅依賴靜音持續時間。兩款模型皆透過單一 API 整合,並使用雙向串流以降低傳輸延遲。
免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆