وفقاً لـ Beating, Resemble AI أصدرت DramaBox، نموذج توليد الكلام، على Hugging Face اليوم. يتميز النموذج بإمكانية تحكم بمستوى المخرج عبر بناء صياغة موجهات منفصلة—يدخل المستخدم الحوار بين علامتي اقتباس، مع تحديد تعليمات المشهد مثل التنهدات أو الوقفات أو الهمسات خارج علامات الاقتباس. يحوّل النموذج هذه التعليمات إلى كلام متأثرًا عاطفيًا بدلًا من قراءتها بصوت عالٍ.
يدعم DramaBox الاستنساخ الصوتي بنمط غير مُسبق (zero-shot) عبر 10 ثوانٍ فقط من تسجيل صوتي مرجعي، كما يتيح توجيهات باللغة الطبيعية لتحديد عمر الشخصية واللهجة والمشاعر. يوفّر إخراجًا بجودة استوديو صوتي ستيريو بمعدل 48kHz. يتضمن كل ما يتم توليده من صوت علامة مائية غير مرئية من Perth مقاومة لضغط MP3 وأدوات تحرير صوت قياسية لمنع إساءة استخدام تقنيات انتحال الهوية العميقة.
Related News
أضافت OpenAI ميزة اكتشاف محادثات “أزمة ChatGPT” لتعزيز قدرات التحذير من العنف الذاتي
واتساب وتُطلق ميتا آي محادثات بلا آثار، ما يؤدي إلى تزايد المخاوف من آليات المساءلة بسبب رسائل تختفي تلقائيًا
تتفاوض Mistral AI مع بنك أوروبي لتطوير نموذج أمني بديل للشبكة باسم Mythos