根據 Beating,Xiaomi 的 AI Lab Kaldi 團隊已將 OmniVoice 進行開源。該模型是一種零樣本語音克隆的 TTS 模型,支援 646 種語言。該模型僅需幾秒的參考音訊即可克隆語音特徵,並能跨語言運作——同一個聲音可以合成中文、日文、韓文以及其他語言的語音。所有程式碼、權重與訓練資料皆在 Apache-2.0 授權下開源。
OmniVoice 採用簡化架構,使用單一雙向 Transformer,直接將文字對應到離散的聲學代幣,並在 PyTorch 中實現比即時快 40 倍的推論速度。OmniVoice 使用來自 50 個開源資料集的 580,000 小時音訊進行訓練,在針對 24 種測試語言的語音相似度與可懂度方面,表現優於商業系統;並在 102 種語言中達到或超過人類錄音的水準。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
TCV 領投 $160M Corgi 保險 新創的 B 輪
Corgi 是一家總部位於美國的商業保險新創公司,據 TechCrunch 報導,該公司於 5 月 6 日宣布由 TCV 領投、估值 13 億美元的 B 輪融資募得 1.6 億美元。此輪融資還包含 Kindred Ventures、Leblon Capital 和 First Order Fund。這使得 Corgi 的累計融資總額達到 2.68
Crypto Frontier7小時前
B.AI 於 5 月 7 日超越 170 萬名用戶,推出獎勵計畫
根據 B.AI,該 AI 基礎設施平台在 5 月 7 日用戶數突破 170 萬。該平台主打隱私保護與代理經濟基礎設施,註冊後為新用戶提供 50 萬個免費額度,所有模型皆採零加價定價,並提供限時 1:1,
GateNews7小時前
Osome 削減 70+ 個角色,透過 AI 轉型將 EBITDA 提升 50%
根據 Tech in Asia,總部位於新加坡的企業管理平台 Osome 在過去兩年已裁撤超過 70 個職位,同時部署 AI 來處理合規任務,例如記錄交易與處理發票。執行長 Eugenio Ferrante 表示,公司放緩了收入增長速度 i
GateNews11小時前
施耐德電機今年將在馬來西亞開設東南亞訓練中心,AI 工具將能源使用量降低 2%-3%
根據路透社報導,施耐德電氣計劃於今年在馬來西亞開設一座東南亞培訓中心,以因應該地區因 AI 基礎設施擴張而導致的電力需求上升。該中心將培訓合作夥伴與客戶,內容涵蓋能源管理系統與資料中心設備。Schneider'
GateNews11小時前
Hut 8 簽 98 億美元 AI 數據中心 15 年長約、股價盤前飆 36%
Hut 8 宣布德州 Beacon Point 1GW AI 資料中心首期 352MW 租約,15 年、基期 98 億美元,含 3% 年增及三次 5 年續約選項;若全部執行,契約值可達約 251 億美元。承租方為高投資等級客戶,名稱尚未公開。此案顯示 Hut 8 從礦業轉型為 AI 基礎建設商,Beacon Point 採 NVIDIA DSX 架構,初期 352MW,預計 2027 年 Q1 通電、Q3 首期廳交付,園區具 1GW 擴展能力。
鏈新聞abmedia20小時前
Core Scientific 以 4.21 億美元收購比特幣礦工 Polaris,擴大全自動化 AI 資料中心營運
根據 The Block,Core Scientific 在今天(5 月 6 日)以約 4.21 億美元收購 Polaris DS LLC,並與 Oklahoma Gas & Electric 確保了一份 440-megawatt 的電力合約,以擴展其 AI 與高效能運算託管業務。Polaris 設施位於俄克拉荷馬,且
GateNews21小時前