أطلقت Thinking Machines نموذج التفاعل باستجابة تبلغ 200 مللي ثانية، وتتفوق على GPT-Realtime-2.0

وفقاً لـ Beating وThinking Machines، وهي المختبر الذي أسسته مايرا موراتي، كبير مسؤولي التكنولوجيا السابق لدى OpenAI، أطلق المختبر نسخة بحثية تجريبية من نموذج Interaction، يتضمن معالجة صوت وفيديو في الوقت الفعلي بشكل أصلي، مع استجابات دقيقة تفصلها 200 مللي ثانية. يتيح النموذج الاستماع والمشاهدة والتحدث في الوقت نفسه، مع دعم مقاطعات المستخدم الفورية.

يستخدم نموذج TML-Interaction-Small بنية MoE تضم 276 مليار معلمة، مع تفعيل 12 مليار معلمة لكل استدلال. تُظهر بيانات رسمية تأخر تبديل أدوار الكلام البالغ 0.40 ثانية، ودرجة FD-bench V1.5 البالغة 77.8، وكلاهما يتجاوز GPT-Realtime-2.0 وGemini 3.1 Flash Live. من المقرر إتاحة وصول محدود للمعاينة خلال الأشهر المقبلة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات