أعلنت Google عن Gemini 3.5 Live Translate، وهو نموذج ذكاء اصطناعي لتحويل الكلام إلى كلام يتيح ترجمة فورية من الصوت إلى الصوت عبر أكثر من 70 لغة. وتوسّع الإطلاق نطاق الترجمة الفورية المتاحة مقارنةً بالاشتراطات السابقة لهواتف Google أو السماعات اللاسلكية المحددة، مع زمن استجابة أقل من عمليات التنفيذ السابقة. وقد سعت Google إلى الترجمة الفورية لسنوات بوصفها أحد تجاربها الرائدة في التعلّم الآلي، حيث كانت قد طرحت سابقاً ترجمة فورية محدودة داخل تطبيق Translate العام الماضي قبل النشر الأوسع اليوم.
مواصفات Gemini 3.5 Live Translate التقنية وعائلة النموذج
يُعدّ Gemini 3.5 Live Translate جزءاً من عائلة الإصدار 3.5 التي انطلقت في I/O. وقبل اليوم، كانت Google قد طرحت فقط نسخة Flash، مع توقع طرح نموذج Pro خلال الأسابيع القادمة. ويُضبط نموذج تحويل الكلام إلى كلام على الكشف والترجمة تلقائياً بأكثر من 70 لغة.
وبحسب Google، فإن Gemini 3.5 Live Translate سريع بما يكفي لمواكبة محادثة عادية، متأخراً بنحو بضعة ثوانٍ فقط عن المتحدث، مع المواءمة أيضاً في النبرة والإيقاع والطبقة الصوتية. ويُخرج النموذج مخرجات صوتية تبدو أقرب إلى صوت المتحدث الأصلي من كونها صوتاً اصطناعياً عاماً. وقد أصدرت Google عروضاً توضيحية سُجلت في ظل ظروف خاضعة للرقابة لتبيان هذه القدرات.
الطرح عبر منظومة Google وإتاحة الوصول للمستخدمين
يبدأ طرح Gemini 3.5 Live Translate عبر عدة أجزاء من منظومة Google. ويتوفر النموذج في Google Meet لترجمة الكلام أثناء مكالمات الفيديو. ويمكن للمستخدمين الوصول إلى قدرات الترجمة دون انتظار فترات تحقق مطوّلة.
وصول واجهة برمجة التطبيقات للمطورين وميزات المعالجة التلقائية
يمكن للمطورين البدء بالبناء عبر معاينة عامة في Gemini Live API أو AI Studio. ويعالج النموذج الكلام باستمرار ويدير جميع المدخلات متعددة اللغات تلقائياً، ما يعفي المطورين من إعدادات التهيئة يدوياً. كما يقوم أيضاً بتصفية الضوضاء الخلفية في البيئات المزدحمة.
الأسئلة الشائعة
ما اللغات التي يدعمها Gemini 3.5 Live Translate؟
يدعم Gemini 3.5 Live Translate أكثر من 70 لغة مع قدرات الكشف والترجمة التلقائية.
أين يمكن للمستخدمين الوصول إلى Gemini 3.5 Live Translate؟
يُطرح النموذج عبر عدة أجزاء من منظومة Google، بما في ذلك Google Meet لترجمة الكلام، ويمكن للمطورين الوصول إليه عبر المعاينة العامة في Gemini Live API أو AI Studio.
كيف يتعامل Gemini 3.5 Live Translate مع معالجة الكلام؟
يعالج النموذج الكلام باستمرار، ويدير مدخلات متعددة اللغات تلقائياً دون إعدادات يدوية، كما يفلتر ضوضاء الخلفية في البيئات المزدحمة مع مواءمة نبرة المتحدث وإيقاعه وطبقته الصوتية.