وفقاً لـ Beating وThinking Machines، وهي المختبر الذي أسسته مايرا موراتي، كبير مسؤولي التكنولوجيا السابق لدى OpenAI، أطلق المختبر نسخة بحثية تجريبية من نموذج Interaction، يتضمن معالجة صوت وفيديو في الوقت الفعلي بشكل أصلي، مع استجابات دقيقة تفصلها 200 مللي ثانية. يتيح النموذج الاستماع والمشاهدة والتحدث في الوقت نفسه، مع دعم مقاطعات المستخدم الفورية.
يستخدم نموذج TML-Interaction-Small بنية MoE تضم 276 مليار معلمة، مع تفعيل 12 مليار معلمة لكل استدلال. تُظهر بيانات رسمية تأخر تبديل أدوار الكلام البالغ 0.40 ثانية، ودرجة FD-bench V1.5 البالغة 77.8، وكلاهما يتجاوز GPT-Realtime-2.0 وGemini 3.1 Flash Live. من المقرر إتاحة وصول محدود للمعاينة خلال الأشهر المقبلة.
Related News
هل تتبع OpenAI نهج Palantir كاستشارات؟ استثمر 4 مليارات لإنشاء شركة مستقلة، وإرسال FDE إلى الشركات لدمج عمليات عمل الذكاء الاصطناعي على نحو عميق
قدمت OpenAI شركة نشر بقيمة 4 مليارات دولار: تستحوذ على Tomoro
موظفو OpenAI يبيعون أسهمًا بقيمة 6.6 مليار دولار، محققين ربحًا متوسطه 11 مليون دولار لكل شخص