Google DeepMind 高管:每一家 AI 产品公司都应构建定制基准

Gate News 消息,4月27日——Google DeepMind 高级产品经理、Google AI Studio 产品负责人 Logan Kilpatrick 在 X 上表示,所有构建基于 AI 的产品的公司都应建立各自的定制基准,以衡量 AI 模型的性能。他将其描述为一种方法,用于让模型改进“对贵公司产生不成比例的收益”,并敦促创始人和商业领袖“从明天开始。”

目前,大多数公司依赖公开排行榜来选择 AI 模型,但这些榜单衡量的是通用能力,往往与特定业务场景不匹配。Kilpatrick 举例称,一家合同审查公司最关心的是条款提取的准确性——而这项能力在公开基准中缺失,导致无法评估模型在该任务上的表现。定制基准具有两项关键优势:首先,它们使公司能够针对自身业务任务评估每一次模型更新,并选择在实际使用场景中表现最佳的模型,而不是选择总体排名最高的模型;其次,它们允许公司将这些测试集与模型提供方共享,从而在与业务相关的领域推动持续优化。

Kilpatrick 指出,像 Zapier 和 Sierra 这样的公司已经在采用这种做法,并表示“这里可以创造出大量的 α(超额收益/优势)。”

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

نواب من ولاية كولورادو يقترحون استبدالًا لقانون للذكاء الاصطناعي لمعالجة مخاوف الصناعة

يتحرك نواب ولاية كولورادو لإلغاء واستبدال قانون الولاية الخاص بالذكاء الاصطناعي لعام 2024، SB24-205، بقواعد جديدة تُضيّق نطاق تنظيم الذكاء الاصطناعي مع معالجة مخاوف الصناعة بشأن أعباء الامتثال. ويقترح مشروع القانون الجديد، SB26-189، تنظيم أنظمة الذكاء الاصطناعي المستخدمة في

CryptoFrontierمنذ 5 س

تقدّم R0AR إلى جولة النهائي في PitchFest ضمن Consensus 2026، لكنه يفلت بصعوبة من قائمة أفضل 20

وفقاً لـ MetaversePost، تقدّم R0AR إلى جولة الاختيار النهائية ضمن CoinDesk's Consensus 2026 PitchFest في 4 مايو، ليفوّت بفارق ضئيل المراكز ضمن أفضل 20 شركة ناشئة من بين الشركات المختارة لعرضها مباشرة. جرى تقييم مبتكر Web3 والذكاء الاصطناعي إلى جانب شركات ناشئة عالية الإمكانات من أنحاء العالم في أحد مرافق الصناعة التي تعد

GateNewsمنذ 8 س

يسعى ماسك إلى تسوية بقيمة 150 مليار دولار مع OpenAI قبل المحاكمة، وتفشل محادثات التسوية

وبحسب وثيقة مقدمة للمحكمة، تواصل إيلون ماسك مع رئيس شركة OpenAI، غريغ بروكمان، في 26 أبريل، قبل يومين من بدء محاكمتهما في المحكمة الفيدرالية بمدينة أوكلاند، بهدف بحث تسوية. وعندما اقترح بروكمان أن تُسقط كلتا الجهتين ادعاءاتهما، رد ماسك بتهديدات قائلاً لبروكمان: "بحلول نهاية

GateNewsمنذ 9 س

يقبل "Cursor" عرض الاستحواذ من "SpaceX" بقيمة 60 مليار دولار، لكنه لن يتعاون مع "xAI" بشأن نماذج البرمجة

وبحسب موقع The Information، قبلت Cursor عرض استحواذ مشروط بقيمة 60 مليار دولار من SpaceX، على الرغم من أن الصفقة لم تُستكمل بعد. ولا توجد لدى الشركة خطط حالياً للتعاون مع وحدة الذكاء الاصطناعي التابعة لـ SpaceX xAI لتطوير نماذج البرمجة. وبدلاً من ذلك، تركز Cursor على تحسينه

GateNewsمنذ 9 س

إغلاق شركة Haun Ventures لصندوق بقيمة 1 مليار دولار في 4 مايو، مع توزيع رأس المال بين استثمارات العملات المشفرة في المراحل المبكرة والمتأخرة

بحسب بلومبرغ، أكملت Haun Ventures جولة جمع تمويل بقيمة 1 مليار دولار في 4 مايو، خُصص منها 500 مليون دولار للاستثمارات في المراحل المبكرة و500 مليون دولار للاستثمارات في المراحل المتأخرة. وسيتم توظيف رأس المال خلال العامين إلى الثلاثة أعوام المقبلة، مع التركيز على شركات ناشئة في مجال العملات المشفرة وتقنية البلوك تشين مع التوسع

GateNewsمنذ 9 س

رفعت OpenAI $4 مليار دولار لتأسيس مشروع مشترك للنشر، بقيمة 10 مليارات دولار

بحسب BlockBeats، في 4 مايو، رفعت OpenAI أكثر من $4 مليار دولار لتأسيس مشروع مشترك جديد يركز على مساعدة الشركات على تبنّي برمجياتها الخاصة بالذكاء الاصطناعي. يُدعم المشروع، الذي يُسمّى The Deployment Company، من 19 مستثمرًا، من بينهم TPG Inc. وBrookfield Asset Management،

GateNewsمنذ 10 س
تعليق
0/400
لا توجد تعليقات