A ElevenLabs e a Stability AI lançaram novos modelos de geração de música com IA nesta semana, ambos destacando dados de treinamento licenciados em meio a uma disputa judicial contínua sobre direitos autorais no setor. A ElevenLabs, empresa de IA de voz fundada na Polônia avaliada em US$ 11 bilhões após uma captação de US$ 500 milhões na Série D em fevereiro, lançou o Music v2. A Stability AI lançou o Stable Audio 3.0, uma família de quatro modelos com pesos abertos para três variantes que geram faixas de até seis minutos e vinte segundos de duração. Os lançamentos seguem processos de 2024 da Recording Industry Association of America contra plataformas de música com IA Suno e Udio, tornando dados de treinamento licenciados um foco central para novos entrantes no mercado. A ElevenLabs firmou acordos de licenciamento com Believe, Kobalt e Merlin, enquanto a Stability AI fez parceria com a Warner Music Group e a Universal Music Group. A Suno, atualmente avaliada em US$ 2,45 bilhões em novembro de 2025, ultrapassou US$ 300 milhões em receita anual recorrente e foi usada por aproximadamente 100 milhões de pessoas, gerando cerca de 7 milhões de músicas por dia.
ElevenLabs Music v2 Features
Music v2 é o segundo modelo musical da ElevenLabs, chegando aproximadamente 10 meses após a primeira versão. O modelo consegue alternar gêneros dentro de uma única faixa—de ópera para heavy metal e de volta—mantendo a coerência composicional. Segundo a ElevenLabs, o modelo lida com rap rápido e incorpora efeitos sonoros não musicais sem a composição se desintegrar.
O modelo inclui funcionalidade de inpainting, permitindo que os usuários selecionem e regenerem seções específicas, deixando o restante da faixa intacto. Os usuários podem montar músicas seção por seção—introdução, verso, refrão—com o modelo mantendo a continuidade ao longo de tudo, em vez de tratar cada clipe como uma geração independente. O suporte multilíngue melhorou, embora a ElevenLabs não tenha publicado detalhes específicos.
O Music v2 alimenta três plataformas: ElevenMusic para criadores, ElevenAPI para desenvolvedores e ElevenCreative para marcas. O modelo já está no ar no ElevenMusic e no ElevenCreative agora. O acesso via API está disponível com entrada antecipada por meio da equipe de vendas.
Pricing Adjustments
A ElevenLabs reduziu os preços do Music v1 e v2 em até 50% para o ElevenAPI e em até 40% para o ElevenCreative self-serve. A empresa atingiu US$ 500 milhões em receita anual recorrente em abril de 2026. O ElevenMusic foi lançado como um app para consumidores em abril.
Stability AI Stable Audio 3.0 Technical Specifications
O Stable Audio 3.0 sai com quatro modelos: Small SFX (efeitos sonoros no dispositivo), Small (composição completa de música no dispositivo), Medium (até 6:20, exige hardware mais forte) e Large (apenas API). Três dos quatro modelos têm pesos abertos disponíveis no Hugging Face. A versão anterior, Stable Audio 2.0, gerava faixas de até três minutos de duração.
Os modelos Small rodam com 459 milhões de parâmetros cada sem exigir GPU. O Medium opera com 1,4 bilhão de parâmetros e gera a saída de 6:20 em aproximadamente 1,31 segundos em uma GPU H200. O Large roda com 2,7 bilhões de parâmetros e é apenas API para organizações com mais de US$ 1 milhão em receita. Os modelos suportam granularidade de geração por segundo, produzindo faixas no comprimento exato solicitado.
A arquitetura usa um autoencoder semântico-acústico que a Stability chama de SAME, projetado para manter a coerência melódica em saídas mais longas. Fine-tuning com LoRA é suportado, permitindo que artistas adaptem os modelos aos próprios catálogos. A funcionalidade de inpainting inclui continuação em segmento único, em múltiplos segmentos e causal para estender faixas além do endpoint original. Os modelos são compatíveis com ComfyUI para configurações locais.
Market Context and Legal Settlements
A Suno atingiu uma avaliação de US$ 2,45 bilhões em novembro de 2025 e cruzou US$ 300 milhões em receita anual recorrente. A Warner Music resolveu seu processo contra a Suno em novembro de 2025. Sony e Universal Music Group permanecem em tramitação na Justiça federal com a Suno.
A Udio resolveu com todos os três grupos de gravadoras principais e opera como um jardim murado—conteúdo gerado na plataforma não pode ser exportado.
Availability
Os modelos Small e Medium do Stable Audio 3.0 estão disponíveis no Hugging Face. O Large está no ar via a API da Stability AI. O Music v2 é gratuito para usuários do ElevenMusic, com planos comerciais disponíveis via ElevenCreative e ElevenAPI.