بوابة الأخبار، 23 أبريل — نشر باحثون من Google، من بينهم He Kaiming وXie Saining، ورقة بحثية تقدم Vision Banana، نموذج عام لفهم الرؤية تم إنشاؤه عبر ضبط تعليمي خفيف لتعليمات نموذج (Gemini 3 Pro Image) image generation model Nano Banana Pro من الشركة. تتمثل الابتكار الرئيسي في توحيد مخرجات جميع مهام الرؤية كصور RGB، ما يتيح إجراء التقطيع وتقدير العمق والتنبؤ بالاتجاهات السطحية عبر توليد الصور دون الحاجة إلى بنى أو دوال خسارة خاصة بكل مهمة.
في التقطيع الدلالي، تفوق Vision Banana على النموذج المتخصص SAM 3 بنسبة 4.7 نقطة مئوية على Cityscapes؛ وفي تجزئة تعبيرات الإحالة، تفوق على SAM 3 Agent. ومع ذلك، تراجع عن SAM 3 في تجزئة الحالات. بالنسبة لمهام ثلاثية الأبعاد، حقق تقدير العمق بمقياس متوسط دقة 0.929 عبر أربعة مجموعات بيانات معيارية، متجاوزًا 0.918 لدى Depth Anything V3، باستخدام بيانات صناعية فقط دون معلومات عمق حقيقية أو معلمات كاميرا أثناء الاستدلال. حقق تقدير الاتجاهات السطحية نتائج على مستوى الأفضل في ثلاثة اختبارات داخلية.
اشتمل الضبط الدقيق على بيانات مهام رؤية قليلة يتم مزجها في تدريب توليد الصور الأصلي، مع الحفاظ على قدرات التوليد لدى النموذج—كانت الأداء مطابقًا لـ Nano Banana Pro الأصلي في اختبارات جودة التوليد. تقترح الورقة أن ما قبل تدريب توليد الصور في مجال الرؤية يتوازي مع ما قبل تدريب توليد النص في اللغة: تتعلم النماذج التمثيلات الداخلية اللازمة لفهم الصور أثناء التوليد، فيما يقتصر الضبط التعليمي للتعليمات على إطلاق هذه القدرة.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
انضم المدير التنفيذي السابق في شركة Qualcomm أليكس كاتووزيان إلى شركة Intel بصفته نائب الرئيس التنفيذي (EVP) للحوسبة للعمّالء والذكاء الاصطناعي المادي في 4 مايو
أعلنت شركة Intel في 4 مايو أن أليكس كاتوزيان، وهو مدير تنفيذي مخضرم قادم من Qualcomm، انضم إلى الشركة بصفته نائب الرئيس التنفيذي والمدير العام لمجموعة الحوسبة السحابية والذكاء الاصطناعي المادي للعملاء، على أن يتبع مباشرةً إلى الرئيس التنفيذي Chen Lixu. أمضى كاتوزيان 25 عامًا في Qualcomm، وكان آخر منصب له يتمثل في e
GateNewsمنذ 10 د
شركة K Wave Media المدرجة في بورصة ناسداك تلغي الخزانة الخاصة بالبيتكوين وتعيد توجيه $485M إلى الذكاء الاصطناعي
قررت شركة K Wave Media المدرجة في ناسداك التخلي عن خطة احتياطيها من البيتكوين، وتحويل 485 مليون دولار إلى استثمارات في الذكاء الاصطناعي، وذلك بعد أقل من عام من جمع 500 مليون دولار لخطة البيتكوين الأصلية
GateNewsمنذ 13 د
أكملت Nova Intelligence جولة التمويل من الفئة A بقيمة 31.5 مليون دولار، بقيادة Chemistry، في 5 مايو
بحسب Fortune، أكملت منصة وكلاء الذكاء الاصطناعي Nova Intelligence جولة تمويل سلسلة أ بقيمة 31.5 مليون دولار في 5 مايو، بقيادة Chemistry. كما شاركت Accel وConviction وSAP.io في الجولة.
تقوم منصة Nova بتحليل البيانات وتحديثها وتوليد شيفرة مخصصة لرواتب الموظفين وسلسلة التوريد و
GateNewsمنذ 27 د
استحوذت Cipher Digital على $200M لتأمين تسهيلات ائتمانية لتوسيع مراكز بيانات الذكاء الاصطناعي والحوسبة عالية الأداء
حسب Globenewswire، حصلت Cipher Digital، وهي شركة تعدين بيتكوين مدرجة في ناسداك، على تسهيل ائتماني متجدد بقيمة 200 مليون دولار من مؤسسات مالية عالمية لتعزيز السيولة وتسريع التوسع في منصة مراكز بيانات الذكاء الاصطناعي والحوسبة عالية الأداء (HPC). وأفادت الشركة بنتائج الربع الأول
GateNewsمنذ 1 س
شركة Quantum Leap تُنجز $200M طرحها للاكتتاب العام، وتسعى إلى الاستحواذات في مجال البلوك تشين والذكاء الاصطناعي
بحسب Businesswire، في 5 مايو، أكملت شركة الاستحواذ ذات الغرض الخاص Quantum Leap طرحاً أولياً عاماً بقيمة 200 مليون دولار، وبدأت التداول في بورصة نيويورك تحت رمز التداول QLEPU. وتخطط الشركة لاستخدام حصيلة الطرح لمتابعة عمليات الاستحواذ ومعاملات الاندماج i
GateNewsمنذ 1 س
تتفق Google وMicrosoft وxAI على السماح للحكومة الأمريكية بالوصول إلى نماذج الذكاء الاصطناعي قبل طرحها للجمهور
وذكرت وزارة التجارة الأمريكية في بيان يوم الثلاثاء أن شركة Alphabet التابعة لـ Google وشركة Microsoft وxAI وافقت على السماح بوصول حكومي مبكر إلى نماذجها الخاصة بالذكاء الاصطناعي من أجل إجراء مراجعة قبل الإطلاق وتقييم السلامة. وستتولى مركز معايير الذكاء الاصطناعي والابتكار التابع لوزارة التجارة القيام بـ
GateNewsمنذ 1 س