أطلقت Google Gemini Omni Flash: تحرير فيديو تفاعلي للحوار، مع دمج YouTube Shorts وGoogle Flow

2026-05-22 03:11:28

أعلنت Google في 19 مايو 2026 على مؤتمر Google I/O 2026 إطلاق أول منتج من سلسلة Gemini Omni، وهو Gemini Omni Flash، كما نشرت في 22 مايو شرحًا تقنيًا رسميًا على موقعها الإلكتروني، وتشمل الدفعة الأولى من المنصات المتكاملة: تطبيق Gemini وGoogle Flow وYouTube Shorts.

الوظائف الأساسية لـ Gemini Omni Flash المؤكدة

تحرير فيديو حواري: يتيح للمستخدمين تحرير مقاطع الفيديو عبر تعليمات بلغة طبيعية، حيث يتم تنفيذ كل تعليمات بشكل تراكمي على أساس التعليمات السابقة. ويحافظ النموذج على اتساق الأدوار والآثار الفيزيائية الموثوقة وتذكر المشهد، ويدعم تغيير الخلفية أو النمط أو الزاوية أو تفاصيل محددة دون الحاجة إلى إعادة توليد المقطع بأكمله.

محاكاة محرك فيزياء متقدمة: يعزز فهم Omni للثقل والاندفاع والديناميكيات المائية بشكل حدسي واقعية المشاهد، ما يسمح للمستخدمين بإنشاء تأثيرات فيزيائية أدق، مثل مشاهد ديناميكية تتضمن تصادم الأجسام وتدفق السوائل وردود الفعل المتسلسلة.

توليد عبر إدخال متعدد الوسائط: يمكن لـ Omni معالجة أي مجموعة من المدخلات (الصور والنصوص ومقاطع الفيديو والمقاطع الصوتية) كتعليمة واحدة، لإنتاج محتوى موحد الإخراج؛ ويدعم الإدخال الصوتي في المرحلة الأولى الاستشهادات الصوتية، بينما سيتم طرح أنواع أخرى من إدخال الصوت لاحقًا.

تكامل المعرفة وتصور المفاهيم بصريًا: يستفيد Omni من معرفة Gemini حول السياقات التاريخية والعلمية والثقافية، متجاوزًا مجرد مطابقة الأنماط؛ إذ يمكنه توليد محتوى توضيحي بناءً على تلميحات موجزة، مثل شرح مفاهيم علمية معقدة كطيّ البروتينات باستخدام رسوم متحركة بالطين.

ميزة الشخصيات الرقمية الافتراضية (Avatar): يمكن للمستخدمين إنشاء نسخة رقمية تتضمن صوتهم، وتوليد مقاطع فيديو تتطابق في المظهر والصوت مع الشخص نفسه؛ وما زالت وظائف تحرير الصوت والصوتي قيد الاختبار، ولم تُطرح بعد لجميع المستخدمين.

SynthID للوسم المائي: آلية شفافية محتوى بالذكاء الاصطناعي مؤكدة

تتضمن جميع مقاطع الفيديو التي يتم إنشاؤها عبر Gemini Omni وسمًا مائيًا رقميًا غير مرئيًا لـ SynthID تلقائيًا. وهذه تقنية وسْم مائي غير مرئي طورتها Google DeepMind؛ ولا يؤثر الوسم بعد تضمينه في جودة الفيديو البصرية. يمكن للمستخدمين التحقق مما إذا كان الفيديو قد تم إنشاؤه بواسطة Gemini Omni عبر ثلاث قنوات مؤكدة: تطبيق Gemini وGemini داخل متصفح Chrome وGoogle Search. وتقول Google إن أداة التحقق من SynthID تهدف إلى مساعدة المستخدمين على فهم كيفية إنشاء المحتوى على الإنترنت وتحريره، ضمن إطار سياساتها لتطوير الذكاء الاصطناعي بطريقة مسؤولة.

قنوات الوصول المؤكدة وخط زمني للإطلاق

متاح فورًا: مشتركو Google AI Plus وPro وUltra المدفوعون، عبر تطبيق Gemini وGoogle Flow

خلال هذا الأسبوع: مستخدمو YouTube Shorts وتطبيق YouTube Create، مجانًا

خلال عدة أسابيع: المطورون وعملاء الشركات، عبر Gemini API وAgent Platform API

الأسئلة الشائعة

ما الفارق التقني في تحديد «نموذج العالم» داخل Gemini Omni Flash مقارنةً بنماذج توليد الفيديو التقليدية؟

تضع Google Gemini Omni بوصفه «نموذج عالم»، أي إن النموذج لا يقتصر على تنفيذ تعيينات توليد من المدخل إلى المخرج، بل يتمتع أيضًا بقدرة على الاستدلال السببي انطلاقًا من قاعدة معرفية واقعية للعالم الحقيقي (تشمل قوانين الفيزياء والسياقات الثقافية والمعرفة التاريخية والعلمية) تم تدريب Gemini عليها؛ مثل التنبؤ بسلوك الأجسام القادمة في المشهد، وتطبيق نتائج محرك فيزياء واقعي، وتحويل الوصف اللغوي إلى محتوى بصري له معنى دلالي. وهذا يختلف من حيث التوجيه المعماري على مستوى أهداف التصميم عن نماذج نشر الفيديو التي تعتمد فقط على مطابقة الأنماط.

هل يمكن إزالة وسم SynthID المائي أو التحايل عليه؟

تؤكد الإيضاحات الرسمية من Google أن وسم SynthID المائي غير مرئي (ولا يؤثر في المحتوى البصري للفيديو)، ويتم تضمينه داخل البنية الرقمية للفيديو، ويمكن التحقق منه عبر أدوات التحقق الرسمية من Google. ولم تكشف Google في الوثائق الرسمية عن الطريقة التقنية التفصيلية لتنفيذ الوسم المائي، ولا توجد حتى الآن سجلات منشورة لتقييمات تقنية مستقلة حول موثوقية SynthID ومقاومته للتلاعب.

ما أنواع المدخلات التي يدعمها Gemini Omni Flash حاليًا، وما أنواع المخرجات التي سيتم توسيعها مستقبلًا؟

يدعم المدخلات المؤكدة: النصوص، والصور الثابتة، ومقاطع الفيديو، والصوت الصوتي (في المرحلة الأولى). وقد أكدت Google في مدونتها الرسمية أن أنواعًا أخرى من إدخال الصوت «قريبًا» سيتم طرحها كإضافة. وبالنسبة للمخرجات، يركز الإصدار الحالي من Omni Flash على مقاطع الفيديو؛ وتقول Google إنه مستقبلًا سيتم دعم نماذج إخراج الصور والصوت ضمن سلسلة Omni، إلا أن جدول الإطلاق الزمني المحدد لم يُؤكد في هذا الإعلان.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

05-22 03:10

يواصل سيتي الإبقاء على شركة Alphabet كاختياره الأبرز مع تحديد هدف سعر بقيمة 447 دولاراً بعد مؤتمر Google I/O 2026

05-21 08:29

كاب كات تعلن شراكة مع Google Gemini لتمكين تحرير الفيديو مباشرة داخل الدردشة

05-21 07:45

المطوّر ثيو يكشف تضاربًا بين ذكاء Google الاصطناعي: فريق واجهة Gemini CLI الأصلي تم تهميشه، ونسخ “أنتيغرافيتي” واجهة Codex