10 年未来公司 Thinking Machines 发表即时互动 AI 模型，主打「边说边聽边作业」

2026-05-12 07:44:18

由前 OpenAI 前高層 Mira Murati 与 John Schulman 共同創辦、百亿美元估值的人工智慧新創公司 Thinking Machines，週二推出首个能「边说边聽」的全雙工 AI 模型预覽版，延遲低至 0.4 秒，挑戰现有人机即时互动模式。

（輝达注资 Thinking Machines Lab 部署 Vera Rubin 提升前沿模型效能）

Thinking Machines 新模型：打破輪流说話的舊模式

现有所有主流 AI 模型，运作方式都是「使用者输入，模型等待，然后回应」。前 OpenAI 技術长 Mira Murati 与 OpenAI 共同創辦人 John Schulman 认为这種輪流回覆的过程就像傳訊息，並不是真正的对話。如今两人聯手創立的 Thinking Machines Lab，於 5 月 11 日正式发表全新「互动模型（Interaction Models）」的研究预覽版，試圖从根本上改變这个现狀。

人們可以同时交談、傾聽、觀看、思考並協作，且是在即时的狀態下。我們设计了一種以同樣方式与人合作的 AI。

我們分享我們的做法、早期成果，以及模型实际运作的快速一瞥。pic.twitter.com/uxl1InS6Ay

— Thinking Machines (@thinkymachines) May 11, 2026

Thinking Machines 指出，当前 AI 模型以單執行緒感知现实：使用者沒说完，模型只能等待；模型沒生成完，感知就凍結。这種设计成为人机協作的瓶頸，让人无法像与真人溝通般自然流暢地与 AI 協作。

两人相信，解法不在於用外部元件修補舊架構，而是从头訓練一个原生支援即时互动的模型。

全雙工架構：能一心二用的 AI 系统

Thinking Machines 发布的模型命名为 TML-Interaction-Small，是一个擁有 2,760 亿參數、实际运作啟动 120 亿參數的混合專家（MoE）架構模型。該系统以 200 毫秒为單位，持续交错處理输入与生成输出，不设定任何人为的輪次边界，真正实现所謂「全雙工（Full Duplex）」互动，就如同打电話，而非傳訊息。

系统採用雙模型设计：「互动模型」负责即时对話、接話与回应；「背景模型」則在后台非同步處理複雜推理、網路搜尋与工具呼叫，再將結果无縫融入进行中的对話。这使 AI 能夠在说話或聆聽的同时，也悄然完成被指派的搜尋或生成圖表任務。

基準測試：全面超越 OpenAI 与 Google

公告指出，在衡量 AI 互动品质的標準測試 FD-bench 中，TML-Interaction-Small 的換話延遲为 0.40 秒，接近人類自然对話的反应速度，远優於 Google Gemini-3.1-flash-live 的 0.57 秒，以及 GPT-realtime-2.0 的 1.18 秒。

深色代表每列表现最佳者，淺色代表即时模型中表现最佳者

来到該團队專为新型互动能力所设计的自有測試，在「时间感知（TimeSpeak）」任務中，TML-Interaction-Small 正確率达 64.7%，GPT-realtime-2.0 僅有 4.3%；在「语音觸发」任務（CueSpeak）中，前者达 81.7%，后者僅 2.9%；在「視覺计數」任務（RepCount-A）中，前者达 35.4%，后者幾乎为零（1.3%）。

Thinking Machines 指出，现有任何商业模型都无法有意義地完成这些任務，包括 OpenAI 与 Google 的思考版（thinking）高階模型。

企业应用潛力：从客服到安全監控

除了更自然的日常对話體验，这項技術在企业场景中的潛在价值同樣值得关注。

以製造业或实验室为例，一个能即时監控影像的 AI，可在偵測到安全違規的瞬间主动发出警报，而无需等待工作人員开口詢问。在语音客服领域，现有系统普遍存在一至两秒的處理延遲，往往是使用者最直接的痛点，而 0.4 秒的回应速度有望根本解決此问題。

目前 TML-Interaction-Small 及其配套的背景模型，僅开放給少數合作夥伴进行研究预覽，公开版本预计於今年稍后推出。Thinking Machines 同时宣布將啟动研究補助计畫，鼓勵学術社群开发更多評測互动品质的新框架。

从人才流动走向穩定成长：Thinking Machines Lab 的下一步

2025 年剛成立的 Thinking Machines Lab，今年稍早才剛因多名創始成員出走至 Meta、延攬 PyTorch 創始人暨 Meta 资深工程師 Soumith Chintala 出任技術长而引发外界关注，目前員工規模已成长至约 130 人。

（祖克柏挖角吞敗仗：拒絕 Meta 六年 15 亿美元邀约的 Andrew Tulloch 是誰？）

今年 3 月，公司也宣布与 Nvidia 合作部署至少一吉瓦的新世代 Vera Rubin 系统，並擴大与 Google Cloud 的合作，推进前沿模型訓練与強化学習研究。

这篇文章百亿新創 Thinking Machines 发表即时互动 AI 模型，主打「边说边聽边作业」最早出现於链新聞 ABMedia。

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。