شارك المراقبون على الذكاء الاصطناعي “xiaohu” في 10 مايو مثالاً على سير عمل يجمع بين GPT وGemini 3.1 Pro: يبدأ باستخدام GPT لتوليد الصور، ثم يستخدم Gemini 3.1 Pro لتحويل الصور إلى محتوى تفاعلي ثلاثي الأبعاد، ويمكن من خلاله تحويل أي موضوع معرفي إلى تطبيقات علمية قابلة للدوران وقابلة للتشغيل. وتعرض تغريدة xiaohu مثالاً يشمل عروض كواكب ثلاثية الأبعاد ونماذج علمية تفاعلية وغيرها، وهو تطبيق عملي محدد لما يُسمّى “سير عمل متعدد النماذج” (multi-model workflow).
بنية سير العمل: GPT لإنشاء الصور → تحويلها إلى 3D باستخدام Gemini 3.1 Pro
التصميم على مرحلتين لسير العمل بأكمله:
المرحلة الأولى: استخدام GPT (GPT-image-1 أو توليد الصور المدمج داخل ChatGPT) لإخراج صورة مرتبطة بالموضوع وتوفير أساس بصري
المرحلة الثانية: إدخال الصورة إلى Gemini 3.1 Pro، حيث يقوم Gemini بتحويل صورة ثنائية الأبعاد إلى محتوى تفاعلي ثلاثي الأبعاد
شكل الإخراج: كائنات ثلاثية الأبعاد قابلة للدوران والتكبير والتفاعل داخل المتصفح
حالات الاستخدام: التعليم العلمي، عرض المنتجات، محتوى تفاعلي قائم على المعرفة
يُعدّ “سير العمل متعدد النماذج” أحد أبرز الاتجاهات الرئيسية في طبقة تطبيقات الذكاء الاصطناعي لعام 2026 — فلم يعد نموذج واحد هو الأداة الشاملة، بل يقوم المطورون بربط أفضل ما لدى نماذج مختلفة، لإنجاز تطبيقات لا يستطيع نموذج واحد تنفيذها.
عرضٌ محدد: كواكب ثلاثية الأبعاد، محتوى علمي تفاعلي، مواقع ويب لبيع السلع بواسطة الروبوتات
المحاورات المتعددة التي نشرها xiaohu في الوقت نفسه:
عرض الكواكب ثلاثية الأبعاد: نظام شمسي قابل للدوران أو نموذج لكوكب واحد
محتوى علمي تفاعلي: تحويل المعرفة المجردة إلى تصور ثلاثي الأبعاد، مناسب للأغراض التعليمية
الموقع المستقبلي لبيع السلع بواسطة آلات البيع الروبوتية: استخدام توليد الصور من GPT مع منصة Tripo 3D لإخراج صفحة ويب للعرض
السمات المشتركة لهذه الأمثلة هي “التوليد البصري + التحويل إلى تفاعل” — إذ يتولّى GPT المسؤولية عن التصورات البصرية الإبداعية، بينما تتولى Gemini أو أدوات ثلاثية الأبعاد أخرى تحويل الصور الثابتة إلى أشكال تفاعلية قابلة للتشغيل. كل جزء على حدة ليس جديداً، لكن التجربة النهائية بعد ربطها معاً تكون أقوى من أي أداة منفردة.
المعنى: يصبح سير العمل متعدد النماذج تدريجياً نمط التطوير السائد
الدروس العملية للمطورين:
اختيار الأدوات أهم من اختيار أقوى نموذج — إذ يتميز GPT بالجانب البصري، وGemini بفهم متعدد الوسائط، وClaude بقدرات سياق طويلة، ولكل طرف “نقطة قوة” خاصة به
انخفاض تكلفة دمج واجهات برمجة تطبيقات النماذج، ما يجعل ربط عدة نماذج على مستوى التنفيذ أمراً قابلاً للتحقق
قد تكون التطبيقات الجديدة على الأرجح عبارة عن “خط أنابيب متعدد النماذج” لا مجرد امتداد لـ “أفضل نموذج واحد”
قيمة هذا الطرح لا تكمن في اختراق تقني، بل في توفير نموذج لتصميم سير العمل
أحداث محددة يمكن متابعتها لاحقاً: ما إذا كانت قدرة Gemini 3.1 Pro على توليد 3D سيتم الإعلان عنها رسمياً كميزة منتج من قِبل Google في نشاط لاحق، وما إذا كان سير العمل متعدد النماذج سيحصل على دعم قوالب افتراضية ضمن أطر مثل LangChain/LlamaIndex، إضافة إلى أمثلة تطبيقية محددة لحالات الاستخدام التجارية (مثل التعليم والتجارة الإلكترونية والتسويق).
ظهرت هذه المقالة التي يعرض فيها xiaohu سير العمل متعدد النماذج لأول مرة في ABMedia ضمن سلسلة أخبار السلسلة.
Related News
صراع “وضع كود” من Anthropic عبر MCP مقابل CLI: أدوات تُقيّد وقت التشغيل وتنقل الرموز من 150 ألف إلى 2 ألف
غاري تان: أنا الآن نادرًا ما أضع أوامر للذكاء الاصطناعي! الرئيس التنفيذي لـ YC يشرح «سير عمل ذكاء اصطناعي قابل للتضاعف»
تطلق Anthorpic وكيلًا ذكاءً اصطناعيًا مخصصًا للتمويل، وكشف أحد المطلعين في الأوساط أن Claude لا يمكنه أن يحل محل المحللين في الجوانب الأساسية
تَمَّ طرح سلسلة بيئية حوسبة الفضاء من إنفيديا، Space-1 Vera Rubin يرسل قدرات الذكاء الاصطناعي على مستوى مراكز البيانات إلى الفضاء
تسلّح GPT-5.5-سايبر من OpenAI المدافعين الإلكترونيين