أعلنت Google عن Gemini 3.5 Live Translate، وهو نموذج ذكاء اصطناعي لتحويل الكلام إلى كلام يتيح ترجمة فورية من الصوت إلى الصوت عبر أكثر من 70 لغة. وتوسّع الإطلاق نطاق الترجمة الفورية المتاحة مقارنةً بالاشتراطات السابقة لهواتف Google أو السماعات اللاسلكية المحددة، مع زمن استجابة أقل من عمليات التنفيذ السابقة. وقد سعت Google إلى الترجمة الفورية لسنوات بوصفها أحد تجاربها الرائدة في التعلّم الآلي، حيث كانت قد طرحت سابقاً ترجمة فورية محدودة داخل تطبيق Translate العام الماضي قبل النشر الأوسع اليوم.

مواصفات Gemini 3.5 Live Translate التقنية وعائلة النموذج

يُعدّ Gemini 3.5 Live Translate جزءاً من عائلة الإصدار 3.5 التي انطلقت في I/O. وقبل اليوم، كانت Google قد طرحت فقط نسخة Flash، مع توقع طرح نموذج Pro خلال الأسابيع القادمة. ويُضبط نموذج تحويل الكلام إلى كلام على الكشف والترجمة تلقائياً بأكثر من 70 لغة.

وبحسب Google، فإن Gemini 3.5 Live Translate سريع بما يكفي لمواكبة محادثة عادية، متأخراً بنحو بضعة ثوانٍ فقط عن المتحدث، مع المواءمة أيضاً في النبرة والإيقاع والطبقة الصوتية. ويُخرج النموذج مخرجات صوتية تبدو أقرب إلى صوت المتحدث الأصلي من كونها صوتاً اصطناعياً عاماً. وقد أصدرت Google عروضاً توضيحية سُجلت في ظل ظروف خاضعة للرقابة لتبيان هذه القدرات.

الطرح عبر منظومة Google وإتاحة الوصول للمستخدمين

يبدأ طرح Gemini 3.5 Live Translate عبر عدة أجزاء من منظومة Google. ويتوفر النموذج في Google Meet لترجمة الكلام أثناء مكالمات الفيديو. ويمكن للمستخدمين الوصول إلى قدرات الترجمة دون انتظار فترات تحقق مطوّلة.

وصول واجهة برمجة التطبيقات للمطورين وميزات المعالجة التلقائية

يمكن للمطورين البدء بالبناء عبر معاينة عامة في Gemini Live API أو AI Studio. ويعالج النموذج الكلام باستمرار ويدير جميع المدخلات متعددة اللغات تلقائياً، ما يعفي المطورين من إعدادات التهيئة يدوياً. كما يقوم أيضاً بتصفية الضوضاء الخلفية في البيئات المزدحمة.

الأسئلة الشائعة

ما اللغات التي يدعمها Gemini 3.5 Live Translate؟
يدعم Gemini 3.5 Live Translate أكثر من 70 لغة مع قدرات الكشف والترجمة التلقائية.

أين يمكن للمستخدمين الوصول إلى Gemini 3.5 Live Translate؟
يُطرح النموذج عبر عدة أجزاء من منظومة Google، بما في ذلك Google Meet لترجمة الكلام، ويمكن للمطورين الوصول إليه عبر المعاينة العامة في Gemini Live API أو AI Studio.

كيف يتعامل Gemini 3.5 Live Translate مع معالجة الكلام؟
يعالج النموذج الكلام باستمرار، ويدير مدخلات متعددة اللغات تلقائياً دون إعدادات يدوية، كما يفلتر ضوضاء الخلفية في البيئات المزدحمة مع مواءمة نبرة المتحدث وإيقاعه وطبقته الصوتية.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

منذ 5 س

تطلق Google ترجمة فورية بين الصوت والصوت باستخدام Gemini 3.5 في 9 يونيو

منذ 7 س

أبل تؤكد أن ذكاء Siri الاصطناعي يعمل على خوادم جوجل خلال WWDC، وتواصل ادعاءات الخصوصية

منذ 12 س

تقدّم سامسونغ جوجل Gemini وOpenAI ChatGPT عبر الشركات التابعة هذا الشهر