DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一

Gate News 消息,4 月 24 日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上取得满分 120/120,与 Axiom 并列第一。

在使用 LeanExplore 与受约束采样的实践模式中,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著超过 Seed-2.0-Prover (35.50)、Gemini 3 Pro (26.50) 和 Seed-1.5-Prover (26.50)。前沿模式结果显示,V4 领先于 Seed-1.5-Prover (110/120) 和 Aristotle (100/120)。

V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选的自然语言解答,自我验证对结果进行筛选,而形式化智能体在 Lean 中完成严格证明。前沿模式结果使用了大规模计算扩展,而实践模式得分更能反映标准部署能力。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

أعلن إيلون ماسك أن xAI قد غيّرت اسمها رسميًا إلى SpaceXAI، وذلك مع دمجها بالكامل ضمن SpaceX

استنادًا إلى إعلان إيلون ماسك (Elon Musk) على منصة X في 6 مايو من التوقيت المحلي، لم يعد xAI موجودًا كشركة مستقلة، إذ تم دمجه بالكامل في SpaceX وإعادة تسميته إلى SpaceXAI. وفي اليوم نفسه، أنهت SpaceXAI اتفاق تعاون على الحوسبة مع شركة أبحاث الذكاء الاصطناعي Anthropic، مما يسمح لها باستخدام نظام الحوسبة الفائق Colossus 1 بطاقة تتجاوز 300 ميغاواط (MW).

MarketWhisperمنذ 9 د

حضر مؤسس شبكة Pi مؤتمر Consensus 2026، وألقى خطاباً حول التحقق من الهوية في عصر الذكاء الاصطناعي

حسب إعلان الحساب الرسمي لمنصة Pi Network على X، ألقى المؤسس المشارك لــ Pi Network فان تشينغ دياو (Chengdiao Fan) يوم 6 مايو في مؤتمر Consensus 2026 الذي عُقد في ميامي بالولايات المتحدة، محاضرة بعنوان «الاندماج العملي بين Web3 وAI وblockchain». كما شارك كوكارليس يوم 7 مايو في نقاش بعنوان «كيفية إثبات أنك إنسان في عالم الذكاء الاصطناعي».

MarketWhisperمنذ 16 د

وافقت شركة آبل على دفع 250 مليون دولار، ضمن تسوية الدعوى الجماعية المتعلقة بـ Apple Intelligence

وفقاً لتقرير هيئة BBC الصادر في 6 مايو، قدمت شركة أبل (Apple) في 5 مايو إلى محكمة اتحادية في كاليفورنيا اتفاقاً مقترحاً للتسوية، وافقت بموجبه على دفع 250 مليون دولار (نحو 184 مليون جنيه إسترليني)؛ وذلك لتسوية دعوى قضائية جماعية تتهم الشركة بإطلاق إعلانات مضللة بخصوص Apple Intelligence وميزات Siri المعتمدة على الذكاء الاصطناعي. وتنفي أبل في نص الاتفاق أي سلوك غير لائق، ولا تزال التسوية خاضعة لموافقة القاضي.

MarketWhisperمنذ 31 د

معاينة Tencent Hunyuan Hy3 تشهد نموًا في نمو الرموز بنسبة 10 أضعاف خلال أسبوعين

منذ إطلاقه قبل أسبوعين، شهدت معاينة Hy3 التابعة لـTencent Hunyuan زيادة بمقدار 10 أضعاف في عدد استدعاءات الرموز مقارنةً بنموذج Hy2 السابق. وقد ارتفع استخدام الرموز في سيناريوهات البرمجة والعمّال (agents) بشكل حاد بشكل خاص، حيث أفادت التطبيقات بما في ذلك WorkBuddy وCodebuddy وQclaw عن نمو

GateNewsمنذ 40 د

اعتبر ماسك إدراج OpenAI ضمن تسلا في أواخر عام 2017، علمت المحكمة

وبحسب شهادة في محاكمة فيدرالية بمدينة أوكلاند بولاية كاليفورنيا، كان إيلون ماسك يدرس إدماج OpenAI في شركة Tesla في أواخر عام 2017 وبدايات عام 2018، وفقاً لـShivon Zilis، وهي مسؤولة تنفيذية في Neuralink وعضو سابق في مجلس إدارة OpenAI. وأدلت Zilis بشهادة بأن ماسك بحث إمكانية عرض مقعد في مجلس إدارة Tesla على Sam Altman

GateNewsمنذ 59 د

النموّ المرتفع لمستخدمي Gemini وClaude يتسارع في أبريل، بينما يَتباطأ نموّ ChatGPT إلى 30% على أساس سنوي

بحسب أحدث تقرير صادر عن بنك أمريكا، شهدت Gemini وClaude نمواً قوياً في عدد المستخدمين خلال أبريل، في حين تباطأ توسع ChatGPT. في زيارات الويب داخل الولايات المتحدة، نمت ChatGPT بنسبة 30% على أساس سنوي إلى 34 مليون زيارة (ما يعادل 6% من حركة مرور Google)، بينما قفزت Claude بنسبة 715% على أساس سنوي إلى 7.1 مليون

GateNewsمنذ 1 س
تعليق
0/400
لا توجد تعليقات