تيمنيت جبرُو ترفض سحب ورقة بحثية عن الذكاء الاصطناعي طُردت بسببها من شركة Google، وبعد خمس سنوات تحققت جميع تنبؤاتها الخمسة الكبرى.

GOOGLX‎-0.6%

谷歌開除Timnit Gebru

في ديسمبر 2020، تلقت تيمنِت جِبرو (كانت تشغل منصب المسؤول المشارك عن فريق أخلاقيات الذكاء الاصطناعي في جوجل آنذاك) أثناء إجازتها رسالة بريد إلكتروني تُفيد بأنها أُقيلت من جوجل. وكان السبب أن جوجل طلبت منها إزالة أو سحب أوراق بحثية مُدرجة فيها أسماء الموظفين، لكنها رفضت. وقد تم تقديم فرضية البحث عن الهلوسة وسوء الفهم وتضخيم التحيز وتكاليف البيئة وعدم إمكانية التحقق من بيانات التدريب والمركزية اللغوية—وقد وُجدت أمثلة عليها في الواقع بعد خمس سنوات في الحياة العملية.

مقارنة الواقع لخمسة نبوءات: حالات مؤكدة وبيانات

الهلوسة وسوء الفهم: وصفت الورقة في 2021 الظاهرة التي سُمّيت لاحقًا بـ«الهلوسة»، والتي تشير إلى أن نماذج اللغات الكبيرة (LLM) لا تفعل سوى ربط أشكال اللغة معًا استنادًا إلى الاحتمالات، دون أي إحالة إلى معنى. وقد أصبحت هذه المشكلة عيبًا معروفًا لدى جميع أنظمة الذكاء الاصطناعي الرئيسية، وتأكدت في تقييمات أكاديمية مستقلة متعددة.

تضخيم التحيز: أداة توظيف بالذكاء الاصطناعي طورتها أمازون منذ 2014، ثم أُلغيت في 2018 بسبب تمييز منهجي ضد المرشحات الإناث. وتعلم النموذج معايير تقييم تميل إلى الرجال من السِير الذاتية التاريخية التي يغلب عليها الرجال. كشفت دراسة أجراها Obermeyer وآخرون ونشرت في 2019 في مجلة Science أن خوارزمية شائعة الاستخدام لتقييم مخاطر الرعاية الصحية كانت تستبدل «شدة الحالة» بـ«إنفاق الرعاية الصحية»، ما أدى إلى أن المرضى السود، رغم حصولهم على درجات خطر متساوية، كانت حالتهم الفعلية أشد. وأكدت الدراسة أن نسبة المرضى السود الذين تم تصنيفهم بعد التصحيح على أنهم يحتاجون رعاية إضافية سترتفع من 17.7% إلى 46.5%.

تكاليف البيئة: كشف تقرير البيئة الصادر عن جوجل في 2024 أن انبعاثات الغازات الدفيئة في 2023 بلغت نحو 14.3 مليون طن متري من مكافئ CO₂، بزيادة 48% عن خط الأساس في 2019. وأكدت جوجل أن السبب الرئيسي هو الارتفاع الكبير في استهلاك الكهرباء لدى مراكز البيانات المدفوع بالذكاء الاصطناعي، وهو ما يهدد بشكل مباشر هدف جوجل المحدد لعام 2030 بتحقيق الحياد الكربوني.

عدم إمكانية التحقق من بيانات التدريب: في ديسمبر 2023، عثرت محطة رصد الويب في جامعة ستانفورد على 3,226 قطعة يُشتبه في أنها تتضمن محتوى إساءة جنسية للأطفال (CSAM) ضمن مجموعة بيانات LAION-5B (التي تتضمن 5.85 مليار زوج من الصور والنصوص، وقد استُخدمت سابقًا في تدريب Stable Diffusion)، منها 1,008 قِطع تم تأكيدها من خلال جهات خارجية. ثم أُزيلت LAION-5B على الفور.

المركزية اللغوية: حللت دراسة أجراها Thompson وآخرون في 2024 مجموعة من البيانات النصية على الويب مكونة من 6.38 مليار جملة، ووجدت أن 57.1% من الجمل تنتمي إلى مجموعات متعددة اللغات على نحو متوازٍ، أي إنها على الأرجح محتوى منخفض الجودة ومتكرر نتج عن الترجمة الآلية. وتبيّن أن هذه النسبة مرتفعة للغاية في اللغات قليلة الموارد، ما يعني أن قواعد بيانات اللغات قليلة الموارد تتعرض لتلوث ناتج ضعيف من الترجمة الآلية.

الحقائق المؤكدة بشأن إقالة جبرو وخلفية الورقة البحثية

تضم الورقة ستة مؤلفين؛ أربعة منهم موظفون في جوجل. وعندما تلقت جبرو إشعار الإقالة كانت في إجازة. وكان شرط جوجل هو سحب أو إزالة إدراج اسم الموظف، فرفضت جبرو ثم أُبلغت خلال إجازتها بقرار الإقالة.

صدرت الورقة رسميًا في مارس 2021. وتوضح الورقة بجلاء أنه لا يمكن—بشكل بنيوي—أن تسمح شركات تُنشئ LLM بالتمويل والحوافز التنافسية بأن تُؤخر «السلامة والأخلاقيات» سرعة طرح المنتج. وقد استُشهد على نطاق واسع بواقعة إقالة جبرو بوصفها تحققًا ملموسًا لهذه الحجة البنيوية.

الأسئلة الشائعة

ما الادعاء الأكاديمي المحوري لورقة «الببغاء العشوائي»؟

وفقًا للورقة نفسها، تتكون الحجة الأساسية من طبقتين: الأولى تقنية، وتحدد خمس فئات من المخاطر المنهجية لدى نماذج LLM: الهلوسة، وتضخيم التحيز، وتكاليف البيئة، وعدم إمكانية التحقق من البيانات، والمركزية اللغوية. أما الطبقة الثانية فهي أعمق وأكثر جوهرية، إذ تشير إلى أن هذه الفئات الخمس من المخاطر يصعب حلها لأن الشركات التي تبني نماذج LLM—في ظل المنافسة والضغوط المالية—تميل بنيويًا إلى إعطاء الأولوية للسرعة على حساب السلامة. وقد اجتازت الورقة عملية مراجعة الأقران في مؤتمر ACM FAccT.

كيف تم اكتشاف مشكلة التحيز في أداة التوظيف بالذكاء الاصطناعي لدى أمازون والتعامل معها؟

وفقًا لتقارير منشورة، بدأ تطوير أداة أمازون للتوظيف بالذكاء الاصطناعي في 2014. وقد تم تدريب النموذج على سجلات تاريخية خلال السنوات العشر الماضية كان الرجال يهيمنون عليها، فتعلم تلقائيًا أنماط تقييم تميل إلى الرجال، ما أدى إلى خصم نقاط تلقائيًا من السير الذاتية التي تتضمن كلمات مثل «women's chess club». تم اكتشاف مشكلة التحيز هذه في 2018، وبعدها ألغت أمازون الأداة فورًا، وأكدت عدم استخدامها لتقييم المرشحين الحقيقيين.

زيادة انبعاثات الكربون في تقرير البيئة لعام 2024 لدى جوجل، هل تُعزى بالكامل إلى الذكاء الاصطناعي؟

وفقًا لتقرير البيئة لعام 2024 الصادر عن جوجل، بلغت انبعاثات الغازات الدفيئة في 2023 نحو 14.3 مليون طن متري من مكافئ CO₂، بزيادة 48% عن خط الأساس في 2019. وقد أشارت جوجل بشكل صريح إلى أن السبب الرئيسي هو الارتفاع الكبير في استهلاك الكهرباء لدى مراكز البيانات الناتج عن الذكاء الاصطناعي. ولم تزعم جوجل في توضيحها أن الزيادة في انبعاثات الكربون تعود بنسبة 100% إلى الذكاء الاصطناعي، لكن اتساع البنية التحتية للذكاء الاصطناعي تم تأكيده كعامل محرك رئيسي للزيادة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات