由前 OpenAI 前高層 Mira Murati 與 John Schulman 共同創辦、百億美元估值的人工智慧新創公司 Thinking Machines,週二推出首個能「邊說邊聽」的全雙工 AI 模型預覽版,延遲低至 0.4 秒,挑戰現有人機即時互動模式。
(輝達注資 Thinking Machines Lab 部署 Vera Rubin 提升前沿模型效能)
Thinking Machines 新模型:打破輪流說話的舊模式
现有所有主流 AI 模型,运作方式都是「用户输入,模型等待,然后回应」。前 OpenAI 技术长 Mira Murati 与 OpenAI 共同创办人 John Schulman 认为这种轮流回复的过程就像传讯息,并不是真正的对话。如今两人联手创立的 Thinking Machines Lab,于 5 月 11 日正式发表全新「互動模型(Interaction Models)」的研究预览版,试图从根本上改变这一现状。
People talk, listen, watch, think, and collaborate at the same time, in real time. We’ve designed an AI that works with people the same way.
We share our approach, early results, and a quick look at our model in action. pic.twitter.com/uxl1InS6Ay
— Thinking Machines (@thinkymachines) May 11, 2026
Thinking Machines 指出,当前 AI 模型以单线程感知现实:用户没说完,模型只能等待;模型没生成完,感知就冻结。这种设计成为人机协作的瓶颈,让人无法像与真人沟通般自然、顺畅地与 AI 协作。
两人相信,解决方案不在于用外部组件修补旧架构,而是从头训练一个原生支持即时互动的模型。
全双工架构:能一心二用的 AI 系统
Thinking Machines 发布的模型命名为 TML-Interaction-Small,是一个拥有 2,760 亿参数、实际运作启动 120 亿参数的混合专家(MoE)架构模型。该系统以 200 毫秒为单位,持续交错处理输入与生成输出,不设置任何人为的轮次边界,真正实现所谓「全双工(Full Duplex)」互动,就如同打电话,而非传讯息。
系统采用双模型设计:「互動模型」负责即时对话、接话与回应;「背景模型」则在后台异步处理复杂推理、网络搜索与工具调用,再将结果无缝融入进行中的对话。这使 AI 能够在说话或聆听的同时,也悄然完成被指派的搜索或生成图表任务。
基准测试:全面超越 OpenAI 与 Google
公告指出,在衡量 AI 互动品质的标准测试 FD-bench 中,TML-Interaction-Small 的换话延迟为 0.40 秒,接近人类自然对话的反应速度,远优于 Google Gemini-3.1-flash-live 的 0.57 秒,以及 GPT-realtime-2.0 的 1.18 秒。
深色代表每列表现最佳者,浅色代表即时模型中表现最佳者
来到该团队专为新型互动能力设计的自有测试,在「时间感知(TimeSpeak)」任务中,TML-Interaction-Small 正确率达 64.7%,GPT-realtime-2.0 仅有 4.3%;在「语音触发」任务(CueSpeak)中,前者达 81.7%,后者仅 2.9%;在「视觉计数」任务(RepCount-A)中,前者达 35.4%,后者几乎为零(1.3%)。
Thinking Machines 指出,现有任何商用模型都无法有意义地完成这些任务,包括 OpenAI 与 Google 的思考版(thinking)高级模型。
企业应用潜力:从客服到安全监控
除了更自然的日常对话体验,这项技术在企业场景中的潜在价值同样值得关注。
以制造业或实验室为例,一个能即时监控影像的 AI,可在侦测到安全违规的瞬间主动发出警报,而无需等待工作人员开口询问。在语音客服领域,现有系统普遍存在一到两秒的处理延迟,往往是用户最直接的痛点,而 0.4 秒的回应速度有望从根本上解决这一问题。
目前 TML-Interaction-Small 及其配套的背景模型,仅开放给少数合作伙伴进行研究预览,公开版本预计于今年稍后推出。Thinking Machines 同时宣布将启动研究补助计划,鼓励学术社群开发更多评测互动品质的新框架。
从人才流动走向稳定成长:Thinking Machines Lab 的下一步
2025 年刚成立的 Thinking Machines Lab,今年稍早才刚因多名创始成员出走至 Meta、延揽 PyTorch 创始人暨 Meta 资深工程师 Soumith Chintala 出任技术长而引发外界关注,目前员工规模已成长至约 130 人。
(祖克伯挖角吞败仗:拒绝 Meta 六年 15 亿美元邀约的 Andrew Tulloch 是谁?)
今年 3 月,公司也宣布与 Nvidia 合作部署至少一吉瓦的新一代 Vera Rubin 系统,并扩大与 Google Cloud 的合作,推进前沿模型训练与强化学习研究。
这篇文章 百亿新创 Thinking Machines 发表即时互动 AI 模型,主打「边说边听边作业」 最早出现于 鏈新聞 ABMedia。
Related News
جوجل: تُستخدم نماذج اللغات الكبيرة في هجمات فعلية، ويمكن للذكاء الاصطناعي تجاوز آليات الأمان الخاصة بالمصادقة الثنائية
طرح Cerebras للاكتتاب العام يدعم سلسلة التوريد للاستفادة: السرد الخاص بـ Vicor في مجال وحدات الطاقة وترخيص تقنيات طاقة الذكاء الاصطناعي
أعلنت OpenAI رسميًا عن تأسيس DeployCo، حيث تجاوزت الدفعة الأولى من رأس المال 4.0 مليار دولار
هل تتبع OpenAI نهج Palantir كاستشارات؟ استثمر 4 مليارات لإنشاء شركة مستقلة، وإرسال FDE إلى الشركات لدمج عمليات عمل الذكاء الاصطناعي على نحو عميق
قدمت OpenAI شركة نشر بقيمة 4 مليارات دولار: تستحوذ على Tomoro