Resemble AI lança o DramaBox, um modelo de fala controlável ao nível de diretor, na Hugging Face hoje

ON2,07%
PROMPT-3,02%
IN-0,9%

De acordo com Beating, Resemble AI lançou hoje o DramaBox, um modelo de geração de fala, na Hugging Face. O modelo traz uma controlabilidade ao nível de direcção através de uma sintaxe de prompts separada—os utilizadores inserem o diálogo entre aspas, enquanto especificam indicações de cena como suspirar, pausas ou sussurros fora das aspas. O modelo transforma essas indicações em discurso com inflexões emocionais, em vez de as ler em voz alta.

O DramaBox suporta clonagem de voz zero-shot com apenas 10 segundos de áudio de referência e permite prompts em linguagem natural para definir a idade, o sotaque e a emoção da personagem. O áudio gerado tem qualidade de estúdio em estéreo a 48 kHz. Todo o áudio gerado inclui uma marca de água invisível de Perth, resistente à compressão MP3 e à edição áudio padrão, para impedir o uso indevido para deepfakes.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário