Gate News 消息,4 月 24 日——DeepSeek 已在 MIT 许可下发布 V4 系列开源模型,权重现已在 Hugging Face 和 ModelScope 上提供。该系列包含两个专家混合 (MoE) 模型:V4-Pro 总参数 1.6 万亿,按每个 token 激活 49 亿;以及 V4-Flash 总参数 2840 亿,按每个 token 激活 130 亿。两者都支持 100 万 token 的上下文窗口。
该架构包含三项关键升级:一种混合注意力机制,结合压缩稀疏注意力 (CSA) 和高度压缩注意力 (HCA),从而显著降低长上下文开销——V4-Pro 在 1M 上下文下的推理 FLOPs 仅为 V3.2 的 27%,用于在推理过程中存储历史信息的 KV 缓存 (VRAM) 仅为 V3.2 的 10%;用流形约束超连接 (mHC) 替代传统残差连接,以增强跨层信号传播稳定性;以及 Muon 优化器以实现更快的训练收敛。预训练使用了超过 32 万亿 tokens 的数据。
后训练采用两阶段方法:首先通过监督微调 (SFT) 和 GRPO 强化学习训练领域特定专家,然后通过在线蒸馏将它们合并为单一模型。V4-Pro-Max (最高推理模式) 声称是最强的开源模型,拥有顶级代码基准,并在推理和智能体任务上显著缩小了与闭源前沿模型的差距。V4-Flash-Max 在算力充足的情况下实现了 Pro 级推理性能,但在纯知识和复杂智能体任务上受限于参数规模。权重以混合 FP4+FP8 精度存储。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
هوسكينسون يناقش دور Midnight في نظام كاردانو البيئي على The Breakdown
تقدّم تشارلز هوسكينسون، مؤسس كاردانو والمؤسس المشارك لإيثريوم، كضيف في الحلقة 701 من بودكاست "The Breakdown" الذي يستضيفه ديفيد جوكشتاين، لبحث مشروع ميدنايت وما يواجهه المستخدمون من تحديات في مجال العملات المشفرة، ورؤيته لمستقبل البلوك تشين. خلال المقابلة، هوسكينسون
CryptoFrontierمنذ 20 د
شركة Berkshire Energy ترى فرصة نمو مدفوعة بزيادة الطلب على الطاقة الناتجة عن الذكاء الاصطناعي
بحسب ما ذكره Beating، في اجتماع مساهمي بيركشاير، أكد الرئيس التنفيذي آبل أن الطلب على الكهرباء الذي تقوده تقنيات الذكاء الاصطناعي يخلق فرص نمو جديدة لأعمال الشركة في مجال الطاقة، حيث تتولى نصف مرافقها للطاقة بالفعل تلبية متطلبات الطاقة المرتبطة بالذكاء الاصطناعي.
في ولاية آيوا، أصبحت مراكز البيانات الآن تُمثل
GateNewsمنذ 3 س
شهادة الأسبوع الأول في الدعوى بين ماسك وألتمن: اعترف بأن XAI تقوم بتقطير OpenAI، وتحذر من أن الذكاء الاصطناعي مثل المُنهي
أدلى ماسك بشهادة في أول أسبوع من الدعوى القضائية في المحكمة الاتحادية في أوكلاند، واتهم سام ألتمان وبروكمان باختلاق طريقة لخداع التمويل غير الربحي المبكر، محذراً من مخاطر “يوم القيامة” الذي قد تسببه أنظمة الذكاء الاصطناعي، واعترف أيضاً بأن جزءاً من xAI تم “تقطيره” من نماذج OpenAI. وذكر أنه استثمر 38 مليون دولار، وشهد على تحول OpenAI من كيان غير ربحي إلى شركة بتقييم بلغ 8 تريليونات دولار. وتُعد استثمارات Microsoft في عام 2022 نقطة تحول جرى اعتبارها انهياراً للثقة. وتجادل OpenAI بأن ماسك كان يحاول جذب الأشخاص وإبعادهما عن الشركة، وأن دفاعه يقوم بدوافع منافسة. وفي الأسبوع الثاني، شملت الشهادات لاحقاً كلّاً من راسل وبروكمان.
ChainNewsAbmediaمنذ 4 س
استحواذ مالي بالذكاء الاصطناعي مرتبط بترا مب على بلوك ستريت مقابل 43 مليون دولار
بحسب مجلة Fortune، استحوذت شركة AI Financial، وهي شركة للعملات المشفرة مرتبطة بعائلة ترامب وسابقًا كانت تُعرف باسم Alt5 Sigma، على Block Street، وهي شركة لبنية تحتية للتشفير، مقابل 43 مليون دولار الأسبوع الماضي. قال ماتيو مورغان، مستشار شركة AI Financial والرئيس التنفيذي لشركة Block Street، إن عملية الاستحواذ لم تكن
GateNewsمنذ 5 س
أسهم Riot تقفز 8% بعد توسيع اتفاقية AMD الخاصة بمراكز البيانات
ارتفعت أسهم شركة تعدين البيتكوين Riot بنسبة 8% بعد توسيع اتفاقها مع AMD الخاص بمراكز البيانات. ويشمل الشراكة الموسعة شروط تمويل محسّنة، ما يبرز التحول الاستراتيجي لدى Riot من تعدين البيتكوين إلى تشغيل مراكز بيانات للذكاء الاصطناعي. وتُشير هذه الخطوة إلى تزايد الثقة
GateNewsمنذ 7 س
حظر ولاية مينيسوتا أدوات الذكاء الاصطناعي لإنشاء صور حميمة غير رضائية، مع فرض غرامات قد تصل إلى $500K
وفقاً لـ Decrypt، أقرّت الهيئة التشريعية في ولاية مينيسوتا مشروع قانون في 2 مايو يحظر على مواقع الويب والتطبيقات تقديم أدوات ذكاء اصطناعي تُنشئ صوراً حميمة غير توافقية لأفراد يمكن التعرّف عليهم. ويمنع القانون المنصات من السماح للمستخدمين بالوصول إلى أدوات «الديب فيك» هذه أو استخدامها، ويحظر أيضاً
GateNewsمنذ 9 س