ElevenLabs et Stability AI lancent de nouveaux modèles d’IA pour la musique avec des données sous licence

ElevenLabs et Stability AI ont sorti cette semaine de nouveaux modèles d’IA pour générer de la musique, tous deux mettant en avant des données d’entraînement sous licence dans un contexte de poursuites pour atteinte au droit d’auteur qui se poursuivent dans l’industrie. ElevenLabs, la société polonaise d’IA vocale valorisée à 11 milliards de dollars après un tour de table Series D de 500 millions de dollars en février, a lancé Music v2. Stability AI a publié Stable Audio 3.0, une famille de quatre modèles avec des poids ouverts pour trois variantes qui génèrent des titres jusqu’à 6 minutes et 20 secondes. Les lancements font suite aux plaintes en matière de droits d’auteur de la Recording Industry Association of America datant de 2024 contre les plateformes de musique IA Suno et Udio, faisant des données d’entraînement sous licence un axe central pour les nouveaux entrants sur le marché. ElevenLabs a conclu des accords de licence avec Believe, Kobalt et Merlin, tandis que Stability AI s’est associée à Warner Music Group et Universal Music Group. Suno, actuellement valorisée à 2,45 milliards de dollars en novembre 2025, a dépassé 300 millions de dollars de revenus annuels récurrents et est utilisée par environ 100 millions de personnes, générant quelque 7 millions de chansons par jour.

Fonctionnalités de ElevenLabs Music v2

Music v2 est le deuxième modèle de musique d’ElevenLabs, arrivé environ 10 mois après la première version. Le modèle peut changer de genres au sein d’un même morceau — de l’opéra au heavy metal et inversement — tout en conservant une cohérence compositionnelle. D’après ElevenLabs, le modèle gère le rap rapide et intègre des effets sonores non musicaux sans que la composition ne se désagrège.

Le modèle inclut une fonctionnalité de inpainting, permettant aux utilisateurs de sélectionner et de régénérer des sections spécifiques tout en laissant le reste du morceau intact. Les utilisateurs peuvent construire des chansons section par section — intro, couplet, refrain — le modèle conservant la continuité tout au long du morceau au lieu de traiter chaque extrait comme une génération autonome. Le support multilingue s’est amélioré, bien qu’ElevenLabs n’ait pas publié de détails spécifiques.

Music v2 alimente trois plateformes : ElevenMusic pour les créateurs, ElevenAPI pour les développeurs, et ElevenCreative pour les marques. Le modèle est disponible dès maintenant sur ElevenMusic et ElevenCreative. L’accès API est disponible via une entrée anticipée par l’équipe commerciale.

Ajustements tarifaires

ElevenLabs a réduit de jusqu’à 50% le prix de Music v1 et v2 pour ElevenAPI, et de jusqu’à 40% pour ElevenCreative en libre-service. La société a atteint 500 millions de dollars de revenus annuels récurrents en avril 2026. ElevenMusic a été lancé comme application grand public en avril.

Spécifications techniques de Stability AI Stable Audio 3.0

Stable Audio 3.0 propose quatre modèles : Small SFX (effets sonores sur appareil), Small (composition musicale complète sur appareil), Medium (jusqu’à 6:20, matériel plus puissant requis) et Large (API uniquement). Trois des quatre modèles disposent de poids ouverts sur Hugging Face. La version précédente, Stable Audio 2.0, générait des morceaux jusqu’à trois minutes.

Les modèles Small fonctionnent avec 459 millions de paramètres chacun sans nécessiter de GPU. Medium fonctionne avec 1,4 milliard de paramètres et génère sa sortie de 6:20 en environ 1,31 seconde sur un GPU H200. Large fonctionne avec 2,7 milliards de paramètres et est réservé aux organisations via l’API, avec plus de 1 million de dollars de revenus. Les modèles prennent en charge une génération granulaire à la seconde près, produisant des titres à la longueur exacte demandée.

L’architecture utilise un autoencodeur sémantique-acoustique, que Stability appelle SAME, conçu pour maintenir la cohérence mélodique sur des sorties plus longues. Le fine-tuning LoRA est pris en charge, permettant aux artistes d’adapter les modèles à leurs propres catalogues. La fonctionnalité de inpainting inclut une continuation sur un seul segment, sur plusieurs segments et une continuation causale pour prolonger les titres au-delà de leur point de fin initial. Les modèles sont pris en charge dans ComfyUI pour les configurations locales.

Contexte de marché et accords juridiques

Suno a atteint une valorisation de 2,45 milliards de dollars en novembre 2025 et a dépassé 300 millions de dollars de revenus annuels récurrents. Warner Music a réglé son procès contre Suno en novembre 2025. Sony et Universal Music Group restent en procédures devant la justice fédérale avec Suno.

Udio a réglé avec les trois principaux labels et fonctionne comme un jardin clos — le contenu généré sur la plateforme ne peut pas être exporté.

Disponibilité

Les modèles Small et Medium de Stable Audio 3.0 sont disponibles sur Hugging Face. Large est en ligne via l’API de Stability AI. Music v2 est gratuit pour les utilisateurs d’ElevenMusic, avec des offres commerciales disponibles via ElevenCreative et ElevenAPI.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire