أطلقت ElevenLabs وStability AI هذا الأسبوع نماذج جديدة لتوليد الموسيقى بالذكاء الاصطناعي، مع التأكيد في كلا الحالتين على بيانات التدريب المرخّصة في ظل استمرار نزاعات حقوق النشر في القطاع. أطلقت ElevenLabs، شركة ذكاء اصطناعي للصوت تأسست في بولندا وقُدّرت قيمتها بـ 11 مليار دولار بعد جولة تمويل من الفئة D بقيمة 500 مليون دولار في فبراير، نموذج Music v2. وأصدرت Stability AI Stable Audio 3.0، وهي عائلة من أربعة نماذج بأوزان مفتوحة لثلاثة أنواع تولّد مقاطع حتى 6 دقائق و20 ثانية. تأتي هذه الإصدارات بعد رفع جمعية صناعة التسجيلات في أمريكا (RIAA) دعاوى حقوق نشر في 2024 ضد منصات موسيقى مدعومة بالذكاء الاصطناعي Suno وUdio، ما يجعل بيانات التدريب المرخّصة محوراً أساسياً بالنسبة لدخول الداخلين الجدد إلى السوق. أبرمت ElevenLabs اتفاقيات ترخيص مع Believe وKobalt وMerlin، بينما عقدت Stability AI شراكة مع Warner Music Group وUniversal Music Group. وصلت قيمة Suno حالياً إلى 2.45 مليار دولار اعتباراً من نوفمبر 2025، وتجاوزت 300 مليون دولار في الإيراد السنوي المتكرر، واُستخدمت من نحو 100 مليون شخص، لتنتج قرابة 7 ملايين أغنية يومياً.
ElevenLabs Music v2 Features
يُعد Music v2 نموذج ElevenLabs الثاني للموسيقى، ووصل بعد نحو 10 أشهر من الإصدار الأول. يمكن للنموذج تغيير الأنواع داخل مقطع واحد—من الأوبرا إلى موسيقى الهيفي ميتال والعودة—مع الحفاظ على اتساق تركيبي. ووفقاً لـ ElevenLabs، يتعامل النموذج مع الراب السريع ويضمن مؤثرات صوتية غير موسيقية دون أن ينهار مضمون التكوين.
يتضمن النموذج وظيفة التضميد (inpainting)، التي تتيح للمستخدمين تحديد وإعادة توليد أجزاء محددة مع ترك بقية المقطع دون تغيير. ويمكن للمستخدمين بناء الأغاني جزءاً جزءاً—مقدمة، بيت، كورس—مع الحفاظ على الاستمرارية عبر كامل المقطع بدل التعامل مع كل مقطع كإنتاج قائم بذاته. تحسّن دعم اللغات المتعددة، رغم أن ElevenLabs لم تنشر تفاصيل محددة.
يدعم Music v2 ثلاث منصات: ElevenMusic للمبدعين، وElevenAPI للمطورين، وElevenCreative للعلامات التجارية. يعمل النموذج حالياً على ElevenMusic وElevenCreative. ويتاح الوصول عبر API عبر دخول مبكر عبر فريق المبيعات.
Pricing Adjustments
خفضت ElevenLabs تسعير Music v1 وv2 بنسبة تصل إلى 50% لـ ElevenAPI وبنسبة تصل إلى 40% لـ ElevenCreative بنظام الخدمة الذاتية. حققت الشركة 500 مليون دولار في الإيراد السنوي المتكرر في أبريل 2026. أُطلق ElevenMusic كتطبيق للمستهلكين في أبريل.
Stability AI Stable Audio 3.0 Technical Specifications
يشحن Stable Audio 3.0 أربعة نماذج: Small SFX (مؤثرات صوتية على الجهاز)، وSmall (التأليف الموسيقي الكامل على الجهاز)، وMedium (حتى 6:20 مع الحاجة إلى عتاد أقوى)، وLarge (متاح عبر API فقط). تتوفر الأوزان المفتوحة لثلاثة من النماذج الأربعة على Hugging Face. كان الإصدار السابق Stable Audio 2.0 يولد مقاطع حتى مدة 3 دقائق.
تعمل نماذج Small على 459 مليون بارامتر لكل نموذج دون الحاجة إلى GPU. ويعمل Medium عند 1.4 مليار بارامتر ويولّد مخرجات 6:20 في حوالي 1.31 ثانية على GPU من نوع H200. يعمل Large عند 2.7 مليار بارامتر وهو متاح عبر API فقط للمنظمات التي تحقق إيرادات تزيد على 1 مليون دولار. تدعم النماذج توليداً بدرجة دقة لكل ثانية، وتنتج مقاطع بالطول الدقيق المطلوب.
تستخدم البنية مُشفّرًا تلقائياً دلالياً-صوتياً تسميه Stability SAME، وهو مصمم للحفاظ على اتساق لحن أطول المخرجات. يدعم الضبط الدقيق باستخدام LoRA، ما يتيح للفنانين تكييف النماذج مع كتالوجاتهم الخاصة. تتضمن وظيفة التضميد تضميداً بجزء واحد وبأجزاء متعددة واستكمالاً سببيًا لتمديد المقاطع بعد نهايتها الأصلية. وتتوفر النماذج في ComfyUI للإعدادات المحلية.
Market Context and Legal Settlements
حققت Suno تقييماً بقيمة 2.45 مليار دولار في نوفمبر 2025 وتجاوزت 300 مليون دولار في الإيراد السنوي المتكرر. وفضّت Warner Music نزاعها ضد Suno في نوفمبر 2025. وما زالت Sony وUniversal Music Group في إجراءات محكمة فيدرالية مع Suno.
استوفت Udio تسويات مع جميع الملصقات الثلاثة الكبرى، وتعمل كـ walled garden—المحتوى المولّد على المنصة لا يمكن تصديره.
Availability
تتوفر نماذج Stable Audio 3.0 Small وMedium على Hugging Face. أما Large فيعمل عبر واجهة Stability AI API. ويُعد Music v2 مجانياً لمستخدمي ElevenMusic، مع توفر باقات تجارية عبر ElevenCreative وElevenAPI.