由前 OpenAI 前高層 Mira Murati 与 John Schulman 共同創辦、百亿美元估值的人工智慧新創公司 Thinking Machines,週二推出首个能「边说边聽」的全雙工 AI 模型预覽版,延遲低至 0.4 秒,挑戰现有人机即时互动模式。
(輝达注资 Thinking Machines Lab 部署 Vera Rubin 提升前沿模型效能)
Thinking Machines 新模型:打破輪流说話的舊模式
现有所有主流 AI 模型,运作方式都是「使用者输入,模型等待,然后回应」。前 OpenAI 技術长 Mira Murati 与 OpenAI 共同創辦人 John Schulman 认为这種輪流回覆的过程就像傳訊息,並不是真正的对話。如今两人聯手創立的 Thinking Machines Lab,於 5 月 11 日正式发表全新「互动模型(Interaction Models)」的研究预覽版,試圖从根本上改變这个现狀。
人們可以同时交談、傾聽、觀看、思考並協作,且是在即时的狀態下。我們设计了一種以同樣方式与人合作的 AI。
我們分享我們的做法、早期成果,以及模型实际运作的快速一瞥。pic.twitter.com/uxl1InS6Ay
— Thinking Machines (@thinkymachines) May 11, 2026
Thinking Machines 指出,当前 AI 模型以單執行緒感知现实:使用者沒说完,模型只能等待;模型沒生成完,感知就凍結。这種设计成为人机協作的瓶頸,让人无法像与真人溝通般自然流暢地与 AI 協作。
两人相信,解法不在於用外部元件修補舊架構,而是从头訓練一个原生支援即时互动的模型。
全雙工架構:能一心二用的 AI 系统
Thinking Machines 发布的模型命名为 TML-Interaction-Small,是一个擁有 2,760 亿參數、实际运作啟动 120 亿參數的混合專家(MoE)架構模型。該系统以 200 毫秒为單位,持续交错處理输入与生成输出,不设定任何人为的輪次边界,真正实现所謂「全雙工(Full Duplex)」互动,就如同打电話,而非傳訊息。
系统採用雙模型设计:「互动模型」负责即时对話、接話与回应;「背景模型」則在后台非同步處理複雜推理、網路搜尋与工具呼叫,再將結果无縫融入进行中的对話。这使 AI 能夠在说話或聆聽的同时,也悄然完成被指派的搜尋或生成圖表任務。
基準測試:全面超越 OpenAI 与 Google
公告指出,在衡量 AI 互动品质的標準測試 FD-bench 中,TML-Interaction-Small 的換話延遲为 0.40 秒,接近人類自然对話的反应速度,远優於 Google Gemini-3.1-flash-live 的 0.57 秒,以及 GPT-realtime-2.0 的 1.18 秒。
深色代表每列表现最佳者,淺色代表即时模型中表现最佳者
来到該團队專为新型互动能力所设计的自有測試,在「时间感知(TimeSpeak)」任務中,TML-Interaction-Small 正確率达 64.7%,GPT-realtime-2.0 僅有 4.3%;在「语音觸发」任務(CueSpeak)中,前者达 81.7%,后者僅 2.9%;在「視覺计數」任務(RepCount-A)中,前者达 35.4%,后者幾乎为零(1.3%)。
Thinking Machines 指出,现有任何商业模型都无法有意義地完成这些任務,包括 OpenAI 与 Google 的思考版(thinking)高階模型。
企业应用潛力:从客服到安全監控
除了更自然的日常对話體验,这項技術在企业场景中的潛在价值同樣值得关注。
以製造业或实验室为例,一个能即时監控影像的 AI,可在偵測到安全違規的瞬间主动发出警报,而无需等待工作人員开口詢问。在语音客服领域,现有系统普遍存在一至两秒的處理延遲,往往是使用者最直接的痛点,而 0.4 秒的回应速度有望根本解決此问題。
目前 TML-Interaction-Small 及其配套的背景模型,僅开放給少數合作夥伴进行研究预覽,公开版本预计於今年稍后推出。Thinking Machines 同时宣布將啟动研究補助计畫,鼓勵学術社群开发更多評測互动品质的新框架。
从人才流动走向穩定成长:Thinking Machines Lab 的下一步
2025 年剛成立的 Thinking Machines Lab,今年稍早才剛因多名創始成員出走至 Meta、延攬 PyTorch 創始人暨 Meta 资深工程師 Soumith Chintala 出任技術长而引发外界关注,目前員工規模已成长至约 130 人。
(祖克柏挖角吞敗仗:拒絕 Meta 六年 15 亿美元邀约的 Andrew Tulloch 是誰?)
今年 3 月,公司也宣布与 Nvidia 合作部署至少一吉瓦的新世代 Vera Rubin 系统,並擴大与 Google Cloud 的合作,推进前沿模型訓練与強化学習研究。
这篇文章 百亿新創 Thinking Machines 发表即时互动 AI 模型,主打「边说边聽边作业」 最早出现於 链新聞 ABMedia。
相关快讯
Google:大型语言模型被用于实际攻击,AI 可绕过双重认证安全机制
Cerebras IPO 推动供应链受益:Vicor 的电源叙事与 AI 电源 IP 授权题材
OpenAI 官方公告:DeployCo 正式成立,首期注资逾 40 亿美元
OpenAI 也走 Palantir 式顾问?砸 40 亿成立独立公司,派 FDE 进企业深度整合 AI 工作流
OpenAI 推出 40 亿美元的部署公司:收购 Tomoro