استناداً إلى أحدث ورقة بحثية صادرة عن Penn State وUCSC وAmazon، بعنوان "Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents"، خلص الباحثون إلى أن قدرات وكلاء الذكاء الاصطناعي على تحديث المعدات تُظهر نمطاً من "التسطّح" عبر نماذج مختلفة. وكشفت الاختبارات المتقاطعة أن تحديثات المعدات لدى نماذج مختلفة تسفر عن مكاسب في الأداء تختلف بنسبة لا تتجاوز 3.1%. كما أظهر نموذج Qwen3.5-9B بحجم 9B أن تحديثاته متكافئة بنيوياً مع التحديثات الرائدة في Claude Opus 4.6.

ومع ذلك، فإن قدرة الوكلاء على الاستفادة من المعدات المحدَّثة تتبع اتجاهاً غير خطي (غير رتيب). تواجه النماذج الضعيفة مثل Qwen3-32B حالتي فشل حاسمتين: "فشل تفعيل المعدات"، بمعدل تحميل مهارات لا يتجاوز 25.1% مقارنةً بـ96% لدى النماذج الأقوى، و"فشل الامتثال للمعدات"، حيث ينخفض الالتزام بالتعليمات بشكل حاد من 0.52 إلى 0.13 خلال التنفيذ الممتد. وأشار باحث الذكاء الاصطناعي Elvis Sar إلى أنماط مماثلة في تجاربه على وكلاء الترميز، ما يوحي بأن الميزانيات الحاسوبية ينبغي أن تُعطي الأولوية لوكلاء التنفيذ على حساب محركات التطور.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

06-02 07:19

أسهم Tencent ترتفع 8% بعد تقرير تطوير وكلاء الذكاء الاصطناعي على WeChat

06-02 06:17

اختبرت شركة Tencent وكلاء الذكاء الاصطناعي في تطبيق WeChat في يونيو، وأتاحت مهاماً عبر التطبيقات المصغّرة

06-02 00:03

تخطط Alphabet لرفع 80 مليار دولار من الأسهم لتمويل البنية التحتية للذكاء الاصطناعي في 2 يونيو

06-01 03:21

عرّف جينسن هوانغ بنية وكلاء الذكاء الاصطناعي في GTC تايبيه 2026: محرك تنسيق يجمع بين نماذج LLM

تحليل متعمق

تسعى Alphabet إلى جمع 80 مليار دولار لتمويل التوسع في البنية التحتية للذكاء الاصطناعي

Oliver Grant06-01 21:34