XAI Grok Hadirkan Custom Voices: Kloning 2 Menit, Verifikasi Identitas Dua Tahap

ChainNewsAbmedia

xAI pada 2 Mei meluncurkan fitur Grok Custom Voices di blog resmi, di mana pengguna hanya perlu merekam suara alami sekitar 1 menit di konsol xAI, lalu sistem akan memprosesnya dalam waktu 2 menit dan menghasilkan model suara kustom yang dapat digunakan untuk TTS dan Voice Agent API. Turut diluncurkan adalah model Grok 4.3, serta antarmuka Voice Library yang menghimpun semua sumber daya suara. Custom Voices juga dirancang dengan mekanisme verifikasi identitas dua tahap untuk mencegah kloning suara orang lain.

Fungsi: rekaman 1 menit, generasi 2 menit, integrasi TTS dan Voice Agent API

Pengguna merekam suara alami sekitar 1 menit di konsol xAI, lalu proses di belakang layar selesai berurutan: (1) verifikasi identitas, (2) pemrosesan suara, (3) produksi model. Dalam total 2 menit, pengguna bisa mendapatkan model suara yang siap digunakan. Custom Voices mewarisi semua kemampuan TTS, termasuk speech tags (tag suara), output multi-bahasa, serta streaming REST dan WebSocket; dapat langsung dipadukan dengan endpoint TTS xAI atau Voice Agent API untuk percakapan real-time dengan agen.

Voice Library yang diluncurkan serentak adalah antarmuka di konsol xAI untuk manajemen terpusat sumber daya suara, yang memungkinkan pengguna menelusuri, melakukan preview, dan mengelola semua suara buatan pengguna serta yang telah disiapkan, sehingga tidak lagi tersebar di banyak antarmuka. Pustaka suara yang telah dipersiapkan menyediakan lebih dari 80 jenis suara dan mendukung 28 bahasa.

Verifikasi identitas dua tahap: mencegah kloning suara orang lain

Sebelum generasi suara, Custom Voices menyiapkan dua tahap verifikasi identitas: pertama, pengguna membacakan sebuah kalimat verifikasi, dan sistem langsung mentranskripsikan rekaman suara bagian tersebut; kedua, sistem menghitung speaker embedding (vektor ciri pembicara) secara terpisah dari kalimat verifikasi dan rekaman lengkap, lalu membandingkan apakah keduanya milik orang yang sama. Hanya jika kedua tahap lolos, barulah masuk ke alur produksi model suara.

xAI secara tegas menyatakan: pengguna tidak dapat men-clone suara menggunakan file rekaman yang sudah ada, dan juga tidak bisa men-clone suara orang lain. Desain ini meniadakan skenario “mengambil rekaman pidato publik milik orang lain lalu menyalinnya langsung”, dengan membatasi kloning suara hanya pada satu pintu masuk, yaitu “rekaman real-time oleh pengguna sendiri”. Bagi pengamat yang menaruh perhatian pada isu penyalahgunaan generasi suara AI (seperti penipuan telepon dan sulih suara tanpa izin), mekanisme ini merupakan respons konkret xAI terhadap isu anti-pemalsuan.

Observasi berikutnya: dirilis bersamaan dengan Grok 4.3, Voice Library diperluas untuk ritme

Custom Voices dan model Grok 4.3 diluncurkan pada hari yang sama, dan xAI mengikat rilis “peningkatan model + penyempurnaan lini alat suara” dalam satu gelombang pengumuman. Titik observasi berikutnya adalah ritme perluasan pustaka suara yang telah dipersiapkan di Voice Library dari 80 jenis ke atas, serta apakah peta 28 bahasa dapat semakin mencakup bahasa-bahasa kecil seperti bahasa Mandarin tradisional. Titik observasi lainnya adalah kasus penggunaan nyata Voice Agent API yang dipublikasikan, khususnya contoh integrasi untuk skenario seperti otomasi layanan pelanggan, pembuatan rekaman podcast, dan layanan pelanggan multi-bahasa.

Artikel ini xAI Grok 推 Custom Voices:2 分鐘克隆、雙階段身分驗證 pertama kali muncul di 鏈新聞 ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Hut 8 menandatangani kontrak senilai 9,8 miliar dolar AS untuk pusat data AI dengan masa sewa 15 tahun; harga saham melonjak 36% sebelum sesi perdagangan.

Hut 8 mengumumkan kesepakatan sewa tahap pertama pusat data AI Beacon Point 1GW di Texas sebesar 352MW, jangka waktu 15 tahun, nilai dasar 9,8 miliar dolar AS, termasuk kenaikan 3% per tahun serta opsi perpanjangan tiga kali masing-masing 5 tahun; jika seluruhnya dijalankan, nilai kontrak bisa mencapai sekitar 25,1 miliar dolar AS. Penyewa adalah pelanggan dengan peringkat investasi tinggi, nama belum dipublikasikan. Kasus ini menunjukkan Hut 8 bertransformasi dari penambang menjadi perusahaan infrastruktur AI, dengan Beacon Point menggunakan arsitektur NVIDIA DSX, tahap awal 352MW, ditargetkan dialiri listrik pada kuartal 1 2027, penyerahan fasilitas tahap pertama pada kuartal 3, dan kawasan tersebut memiliki kemampuan ekspansi hingga 1GW.

ChainNewsAbmedia2jam yang lalu

Core Scientific Mengakuisisi Penambang Bitcoin Polaris senilai $421 juta, Memperluas Operasi Pusat Data AI

Menurut The Block, Core Scientific mengakuisisi Polaris DS LLC dengan perkiraan nilai $421 juta hari ini (6 Mei), sekaligus mengamankan kontrak daya 440 megawatt dengan Oklahoma Gas & Electric untuk memperluas bisnis hosting AI dan komputasi berkinerja tinggi. Fasilitas Polaris, yang berlokasi di Oklahoma dan

GateNews2jam yang lalu

Hut 8 Mengunci Pendapatan Pusat Data AI $16,8B, Merilis 3.300 BTC di Q1

Menurut PRNewswire, perusahaan penambangan Bitcoin Hut 8 yang terdaftar di Nasdaq melaporkan hasil keuangan Q1 2026 pada 6 Mei, mengungkapkan bahwa dua taman AI berukuran mega menghasilkan 16,8 miliar dolar AS pendapatan sewa. Perusahaan merilis sekitar 3.300 BTC (kurang lebih 260 juta dolar AS) melalui refinisi pinjaman yang didukung Bitcoin

GateNews6jam yang lalu

Prophet Meluncurkan Pasar Prediksi Berbasis AI dengan Kupon Perdagangan Langsung $10.000 Hari Ini

Menurut MetaversePost, Prophet meluncurkan pasar prediksi bertenaga AI hari ini (6 Mei) dengan $10.000 dalam USDC yang dialokasikan untuk perdagangan langsung. Pengguna dapat berdagang langsung melawan pihak lawan AI yang menghasilkan harga berbasis probabilitas untuk setiap pasar, dengan beberapa kontrak yang akan diselesaikan dalam waktu 24

GateNews6jam yang lalu

WorldClaw Meluncurkan WorldRouter dengan WLFI, Menawarkan 300+ Model AI dengan Biaya 30% Lebih Rendah

Menurut WorldClaw, perusahaan meluncurkan WorldRouter bekerja sama dengan World Liberty Fi, yang memungkinkan pengguna mengakses lebih dari 300 model AI melalui satu akun dengan biaya sekitar 30% lebih rendah dibandingkan harga langsung penyedia. WorldRouter berfungsi sebagai titik masuk pertama ke AgentOS milik WorldClaw,

GateNews7jam yang lalu

Laba Kakao Pay Kuartal 1 Melonjak 141% Seiring Pertumbuhan Layanan Keuangan

Kakao Pay, penyedia pembayaran mobile asal Korea Selatan, melaporkan laba bersih kuartal pertamanya naik 141,5% year on year menjadi 34,7 miliar won (AS$23,8 juta), menurut pengumuman pendapatan perusahaan. Laba operasional melonjak menjadi 32,2 miliar won (AS$21,9 juta) dari 4,4 miliar won (AS$2,99 mill

CryptoFrontier7jam yang lalu
Komentar
0/400
Tidak ada komentar