GPT-5.5 تعود إلى الصدارة في البرمجة، لكن OpenAI تغيّر المعايير بعد الخسارة أمام Opus 4.7

رسالة أخبار البوابة، 27 أبريل — أصدرت شركة SemiAnalysis، وهي شركة متخصصة في تحليل أشباه الموصلات والذكاء الاصطناعي، معيارًا/مقارنة مرجعية (benchmark) لتقييم المساعدين البرمجيين، بما في ذلك GPT-5.5 و Claude Opus 4.7 و DeepSeek V4. وكانت النتيجة الرئيسية: تُعدّ GPT-5.5 أول عودة من OpenAI إلى صدارة التقدم في نماذج البرمجة خلال ستة أشهر، حيث بات مهندسو SemiAnalysis يتناوبون الآن بين Codex وClaude Code بعد أن كانوا يعتمدون تقريبًا حصريًا على Claude. تستند GPT-5.5 إلى نهج تدريب مسبق جديد مُشفّر باسم “Spud” وتمثل أول توسع في حجم التدريب المسبق من OpenAI منذ GPT-4.5.

في الاختبارات العملية، ظهرت قسمة واضحة للأدوار. يتولى Claude تخطيط المشروعات الجديدة والإعداد الأولي، بينما يتفوق Codex في إصلاحات الأعطال التي تتطلب التفكير المكثف. يُظهر Codex فهمًا أقوى لهياكل البيانات والاستدلال المنطقي، لكنه يواجه صعوبة في استنتاج نية المستخدم الغامضة. في مهمة ضمن لوحة تحكم واحدة، أعاد Claude تلقائيًا تخطيط صفحة المرجع لكنه اخترع كميات كبيرة من البيانات، بينما تخطى Codex التخطيط لكنه قدّم بيانات أدق بكثير.

تكشف التحليلات عن تفاصيل تلاعب بالمعيار/المقارنة المرجعية: حثّت مشاركة مدونة OpenAI في فبراير الصناعة على اعتماد SWE-bench Pro بوصفه المعيار/المرجع الجديد لمقاييس البرمجة. ومع ذلك، غيّرت إعلانات GPT-5.5 إلى معيار/مرجع جديد يُسمى “Expert-SWE.” والسبب، المدفون في تفاصيل دقيقة، هو أن GPT-5.5 تفوقت عليها Opus 4.7 على SWE-bench Pro وتراجعت بشكل كبير عن Mythos (77.8%) غير المُعلن من Anthropic.

وبخصوص Opus 4.7، نشرت Anthropic تحليلًا بعد الوفاة (postmortem) بعد أسبوع واحد من الإصدار، واعترفت بوجود ثلاث حالات خلل (bugs) في Claude Code استمرت لعدة أسابيع من مارس إلى أبريل، مما أثّر على ما يقرب من جميع المستخدمين. وكان قد أبلغ عدة مهندسين سابقًا عن تدهور في الأداء في الإصدار 4.6، لكن تم تجاهل ذلك باعتباره ملاحظات ذاتية. بالإضافة إلى ذلك، فإن المُرمّز (tokenizer) الجديد في Opus 4.7 يزيد استخدام الـ tokens بنسبة تصل إلى 35%، وهو ما اعترفت به Anthropic بشكل صريح—وهو ما يشكّل فعليًا زيادةً خفية في السعر.

تم تقييم DeepSeek V4 على أنه “يواكب وتيرة الخط الأمامي لكنه لا يتصدر,” مع وضع نفسه كبديل الأقل تكلفة بين نماذج المصدر المغلق. وأشارت التحليلات أيضًا إلى أن “Claude لا يزال يتفوق على DeepSeek V4 Pro في مهام الكتابة الصينية عالية الصعوبة،” مع تعليق بأن “Claude فاز على النموذج الصيني بلغته الخاصة.”

يقدم المقال مفهومًا رئيسيًا: ينبغي تقييم تسعير النماذج من خلال “تكلفة المهمة” بدلًا من “تكلفة الـ token.” إن تسعير GPT-5.5 ضعف تسعير GPT-5.4 (input $5, output $30 per million tokens)، لكنه ينجز المهام نفسها باستخدام tokens أقل، مما يعني أن التكلفة الفعلية ليست بالضرورة أعلى. تُظهر بيانات SemiAnalysis الأولية أن نسبة إدخال Codex إلى إخراجه هي 80:1، وهي أقل من نسبة Claude Code البالغة 100:1.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

ارتفاع شركة Samsung Electro-Mechanics مع تزايد الطلب على تقنيات الذكاء الاصطناعي، وKB Securities ترفع السعر المستهدف في 4 مايو

ذكرت شركة KB Securities في 4 مايو أن شركة Samsung Electro-Mechanics أبقت على تصنيف الشراء ورفعت سعرها المستهدف، مستشهدةً بطلب قوي على المكثفات الخزفية متعددة الطبقات وعلى ركائز FC-BGA المستخدمة في خوادم الذكاء الاصطناعي. وأعلنت الشركة عن إيرادات للربع الأول بلغت 3.2 تريليون وون (2.18 مليار دولار) و

GateNewsمنذ 8 د

تعزز Meta AI تفاعل Facebook وInstagram في الربع الأول من السنة المالية 2026؛ ارتفع الوقت الذي يقضيه المستخدمون في Reels بنسبة 10%

أفادت صحيفة The Economic Times أن نتائج Meta للربع الأول من السنة المالية 26 أظهرت أن ترقيات الذكاء الاصطناعي عززت تفاعل المستخدمين مع الفيديو عبر Facebook وInstagram. ارتفع الوقت الذي يقضيه المستخدمون في Instagram Reels بنسبة 10%، بينما زاد وقت مشاهدة فيديوهات Facebook بأكثر من 8% على مستوى العالم. كما ارتفع متوسط السعر لكل إعلان بنسبة 12% على أساس سنوي، وأكثر من 8

GateNewsمنذ 8 د

دراسة حديثة من كلية الطب في جامعة هارفارد: يتفوّق الذكاء الاصطناعي في قرارات التشخيص داخل قسم الطوارئ على الأطباء البشر

نُشرت دراسة أجرتها كلية الطب في جامعة هارفارد في مجلة «ساينس»، حيث قيّمت بشكل موضوعي الفروق في قراءة السجلات الطبية بين أنظمة الذكاء الاصطناعي والأطباء البشر عبر الاختبارات المزدوجة التعمية والاستدلال السريري. وأظهرت النتائج أن الذكاء الاصطناعي يمكن أن يضاهي أو يتفوق على طبيب المعالجة في نقاط اتخاذ القرار المبكرة في قسم الطوارئ، وبالاعتماد فقط على معلومات السجلات الطبية الإلكترونية المتاحة آنذاك. وتؤكد الدراسة كذلك أن الذكاء الاصطناعي لا يستطيع حتى الآن ممارسة المهنة بشكل مستقل، وأن الأطباء ما زالوا عنصرًا لا غنى عنه؛ ومع الاستخدام الواسع، يمكن أن يساهم الذكاء الاصطناعي في تقليل أخطاء التشخيص وتكاليف الذهاب إلى الطبيب.

ChainNewsAbmediaمنذ 24 د

تكتلات كوريا الجنوبية الكبرى العشرة تحقق مكاسب بنسبة 65% إلى 2.6 تريليون دولار مع ارتفاع أسهم رقائق الذكاء الاصطناعي

بحسب The Korea Herald، شهدت أكبر 10 مجموعات كبرى في كوريا الجنوبية ارتفاعًا في قيمتها السوقية المجمعة بنسبة 65% لتصل إلى 3,832.7 تريليون وون (2.6 تريليون دولار أمريكي)، مدفوعًا بارتفاع أسهم الرقائق المرتبطة بالذكاء الاصطناعي. وسجّلت SK Group أكبر مكاسب، إذ ارتفعت بنسبة 89.6% إلى 1,139.8 تريليون وون (775 مليار دولار أمريكي)، مدفوعة بـ

GateNewsمنذ 27 د

الاستثمارات المدعومة بالذكاء الاصطناعي دفعت 75% من نمو الناتج المحلي الإجمالي الأمريكي في الربع الأول، وفقاً لمستشار بالبيت الأبيض

في تعليق أدلى به ديفيد ساكس، مستشار البيت الأبيض لشؤون الذكاء الاصطناعي والعمالات الرقمية، بشأن بيانات مورغان ستانلي الصادرة في أوائل مايو، أسهمت الاستثمارات المرتبطة بالذكاء الاصطناعي بنحو 75% من نمو الناتج المحلي الإجمالي الأمريكي في الربع الأول من 2026. وأشار ساكس إلى أن استثمار الذكاء الاصطناعي سيقود نحو 2.5% من نمو الناتج المحلي الإجمالي هذا العام و

GateNewsمنذ 32 د

مواهب الذكاء الاصطناعي تكسب ما يصل إلى 25% أكثر في سنغافورة، وفقاً لعرض NodeFlair

وبحسب تقرير الرواتب التقنية لعام 2026 الصادر عن NodeFlair في 4 مايو، حقق مهندسو البرمجيات في سنغافورة ممن لديهم مهارات في الذكاء الاصطناعي زيادات تتراوح بين 13% و25% مقارنةً بأقرانهم من دون هذه الخبرة. وقد استندت النتائج إلى أكثر من 230,000 نقطة بيانات رواتب موثقة. وتفاوتت زيادات الرواتب بحسب المستوى الوظيفي، مع

GateNewsمنذ 1 س
تعليق
0/400
لا توجد تعليقات