xAI 5 月 2 日於官方部落格推出 Grok Custom Voices 功能,使用者只需在 xAI 控制台錄製約 1 分鐘的自然語音、系統會在 2 分鐘內處理完成、產出可用於 TTS 與 Voice Agent API 的客製聲音模型。同步推出的還有 Grok 4.3 模型、以及彙整全部聲音資源的 Voice Library 介面。Custom Voices 並設計雙階段身分驗證機制、防止克隆他人聲音。
功能:1 分鐘錄音、2 分鐘生成、整合 TTS 與 Voice Agent API
使用者在 xAI 控制台錄製約 1 分鐘的自然語音、後台流程依序完成:(1)身分驗證、(2)語音處理、(3)模型產出。整體 2 分鐘內可拿到可用的聲音模型。Custom Voices 繼承所有 TTS 能力、包含 speech tags(語音標籤)、多語輸出、以及 REST 與 WebSocket 串流;可直接搭配 xAI 的 TTS 端點或 Voice Agent API 用於即時對話 agent。
同步推出的 Voice Library 是 xAI 控制台中統一管理聲音資源的介面、可瀏覽、預覽、管理使用者自製與預建的所有聲音、避免分散在多個介面。預建聲音庫提供 80 種以上聲音、支援 28 種語言。
雙階段身分驗證:防止克隆他人聲音
Custom Voices 在語音生成前設置兩道身分驗證關卡:第一道、使用者朗讀一段驗證句、系統即時轉錄該段語音;第二道、系統從驗證句與完整錄音中分別計算 speaker embedding(說話者特徵向量)、比對兩者是否屬於同一人。只有兩階段都通過、才會進入聲音模型產出流程。
xAI 明確聲明:使用者無法用既有錄音檔克隆聲音、也無法克隆他人聲音。這套設計排除「拿到他人公開演講錄音直接複製」的使用情境、把克隆聲音的範圍限縮在「使用者本人即時錄製」這一個入口。對於關注 AI 語音生成濫用議題(如電話詐騙、未經授權配音)的觀察者而言、這套機制是 xAI 對防偽議題的具體回應。
後續觀察:與 Grok 4.3 同步推出、Voice Library 擴增節奏
Custom Voices 與 Grok 4.3 模型同日推出、xAI 將「模型升級 + 語音工具線完整化」綁在同一波發表。下一個觀察點是 Voice Library 預建聲音庫從 80 種往上擴增的節奏、以及 28 語言版圖能否進一步覆蓋繁體中文等小語種;另一個觀察點是 Voice Agent API 的具體採用案例公開、特別是客服自動化、podcast 錄製、多語客戶服務等場景的整合範例。
這篇文章 xAI Grok 推 Custom Voices:2 分鐘克隆、雙階段身分驗證 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Hut 8 簽 98 億美元 AI 數據中心 15 年長約、股價盤前飆 36%
Hut 8 宣布德州 Beacon Point 1GW AI 資料中心首期 352MW 租約,15 年、基期 98 億美元,含 3% 年增及三次 5 年續約選項;若全部執行,契約值可達約 251 億美元。承租方為高投資等級客戶,名稱尚未公開。此案顯示 Hut 8 從礦業轉型為 AI 基礎建設商,Beacon Point 採 NVIDIA DSX 架構,初期 352MW,預計 2027 年 Q1 通電、Q3 首期廳交付,園區具 1GW 擴展能力。
鏈新聞abmedia2小時前
Core Scientific 以 4.21 億美元收購比特幣礦工 Polaris,擴大全自動化 AI 資料中心營運
根據 The Block,Core Scientific 在今天(5 月 6 日)以約 4.21 億美元收購 Polaris DS LLC,並與 Oklahoma Gas & Electric 確保了一份 440-megawatt 的電力合約,以擴展其 AI 與高效能運算託管業務。Polaris 設施位於俄克拉荷馬,且
GateNews3小時前
Hut 8 鎖定 168 億美元 AI 資料中心營收,並在第 1 季釋出 3,300 BTC
根據 PRNewswire,納斯達克上市的比特幣挖礦公司 Hut 8 於 5 月 6 日公布其 2026 年第 1 季財務結果,披露其兩座超大型 AI 園區產生了 168 億美元的租賃收入。該公司透過一項以比特幣為擔保的貸款再融資,釋出約 3,300 BTC(約 2.6 億美元)
GateNews6小時前
Prophet 今日推出以 AI 驅動的預測市場,並啟用 10,000 美元的即時交易分批
根據 MetaversePost,Prophet 於今日(5 月 6 日)推出一個由 AI 驅動的預測市場,配置 10,000 美元的 USDC 用於進行現場交易。使用者可以直接與由 AI 作為對手方的交易進行交易,該對手方會為每個市場產生基於機率的定價;部分合約可在 24 小時內結算
GateNews7小時前
WorldClaw 推出搭載 WLFI 的 WorldRouter,提供 300+ 個 AI 模型,成本降低 30%
根據 WorldClaw,該公司與 World Liberty Fi 合作推出 WorldRouter,讓使用者能透過單一帳戶存取超過 300 個 AI 模型,成本大約比直接供應商定價低 30%。WorldRouter 作為進入 WorldClaw 的 AgentOS 之首個入口,
GateNews7小時前
Kakao Pay 第 1 季獲利因金融服務成長大幅飆升 141%
Kakao Pay,這家南韓行動支付供應商,根據公司財報公告,其第一季淨利年增 141.5% 至 34.7 兆韓元(23.8 百萬美元);營業利潤則從 4.4 兆韓元(2.99 百萬美元)躍升至 32.2 兆韓元(21.9 百萬美元)
Crypto Frontier8小時前