Resemble AI lança o DramaBox, modelo de fala controlável no nível de diretor, na Hugging Face hoje

ON2,07%
PROMPT-3,02%
IN-0,9%

De acordo com Beating, a Resemble AI lançou o DramaBox, um modelo de geração de fala, na Hugging Face hoje. O modelo oferece controlabilidade no nível de direção por meio de uma sintaxe de prompts separada — os usuários inserem o diálogo entre aspas, enquanto especificam marcações de cena como suspirar, pausas ou sussurros fora das aspas. O modelo transforma essas marcações em fala com inflexão emocional, em vez de lê-las em voz alta.

O DramaBox oferece clonagem de voz zero-shot com apenas 10 segundos de áudio de referência e permite prompts em linguagem natural para definir idade, sotaque e emoção do personagem. A saída é áudio de qualidade de estúdio em estéreo a 48 kHz. Todo áudio gerado inclui uma marca d’água invisível de Perth, resistente à compressão MP3, além de edição de áudio padrão para evitar uso indevido de deepfakes.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários