百億新創 Thinking Machines 發表即時互動 AI 模型,主打「邊說邊聽邊作業」

鏈新聞abmedia

由前 OpenAI 前高層 Mira Murati 與 John Schulman 共同創辦、百億美元估值的人工智慧新創公司 Thinking Machines,週二推出首個能「邊說邊聽」的全雙工 AI 模型預覽版,延遲低至 0.4 秒,挑戰現有人機即時互動模式。

(輝達注資 Thinking Machines Lab 部署 Vera Rubin 提升前沿模型效能)

Thinking Machines 新模型:打破輪流說話的舊模式

現有所有主流 AI 模型,運作方式都是「使用者輸入,模型等待,然後回應」。前 OpenAI 技術長 Mira Murati 與 OpenAI 共同創辦人 John Schulman 認為這種輪流回覆的過程就像傳訊息,並不是真正的對話。如今兩人聯手創立的 Thinking Machines Lab,於 5 月 11 日正式發表全新「互動模型(Interaction Models)」的研究預覽版,試圖從根本上改變這個現狀。

People talk, listen, watch, think, and collaborate at the same time, in real time. We’ve designed an AI that works with people the same way.

We share our approach, early results, and a quick look at our model in action. pic.twitter.com/uxl1InS6Ay

— Thinking Machines (@thinkymachines) May 11, 2026

Thinking Machines 指出,當前 AI 模型以單執行緒感知現實:使用者沒說完,模型只能等待;模型沒生成完,感知就凍結。這種設計成為人機協作的瓶頸,讓人無法像與真人溝通般自然流暢地與 AI 協作。

兩人相信,解法不在於用外部元件修補舊架構,而是從頭訓練一個原生支援即時互動的模型。

全雙工架構:能一心二用的 AI 系統

Thinking Machines 發布的模型命名為 TML-Interaction-Small,是一個擁有 2,760 億參數、實際運作啟動 120 億參數的混合專家(MoE)架構模型。該系統以 200 毫秒為單位,持續交錯處理輸入與生成輸出,不設定任何人為的輪次邊界,真正實現所謂「全雙工(Full Duplex)」互動,就如同打電話,而非傳訊息。

系統採用雙模型設計:「互動模型」負責即時對話、接話與回應;「背景模型」則在後台非同步處理複雜推理、網路搜尋與工具呼叫,再將結果無縫融入進行中的對話。這使 AI 能夠在說話或聆聽的同時,也悄然完成被指派的搜尋或生成圖表任務。

基準測試:全面超越 OpenAI 與 Google

公告指出,在衡量 AI 互動品質的標準測試 FD-bench 中,TML-Interaction-Small 的換話延遲為 0.40 秒,接近人類自然對話的反應速度,遠優於 Google Gemini-3.1-flash-live 的 0.57 秒,以及 GPT-realtime-2.0 的 1.18 秒。

深色代表每列表現最佳者,淺色代表即時模型中表現最佳者

來到該團隊專為新型互動能力所設計的自有測試,在「時間感知(TimeSpeak)」任務中,TML-Interaction-Small 正確率達 64.7%,GPT-realtime-2.0 僅有 4.3%;在「語音觸發」任務(CueSpeak)中,前者達 81.7%,後者僅 2.9%;在「視覺計數」任務(RepCount-A)中,前者達 35.4%,後者幾乎為零(1.3%)。

Thinking Machines 指出,現有任何商業模型都無法有意義地完成這些任務,包括 OpenAI 與 Google 的思考版(thinking)高階模型。

企業應用潛力:從客服到安全監控

除了更自然的日常對話體驗,這項技術在企業場景中的潛在價值同樣值得關注。

以製造業或實驗室為例,一個能即時監控影像的 AI,可在偵測到安全違規的瞬間主動發出警報,而無需等待工作人員開口詢問。在語音客服領域,現有系統普遍存在一至兩秒的處理延遲,往往是使用者最直接的痛點,而 0.4 秒的回應速度有望根本解決此問題。

目前 TML-Interaction-Small 及其配套的背景模型,僅開放給少數合作夥伴進行研究預覽,公開版本預計於今年稍後推出。Thinking Machines 同時宣布將啟動研究補助計畫,鼓勵學術社群開發更多評測互動品質的新框架。

從人才流動走向穩定成長:Thinking Machines Lab 的下一步

2025 年剛成立的 Thinking Machines Lab,今年稍早才剛因多名創始成員出走至 Meta、延攬 PyTorch 創始人暨 Meta 資深工程師 Soumith Chintala 出任技術長而引發外界關注,目前員工規模已成長至約 130 人。

(祖克柏挖角吞敗仗:拒絕 Meta 六年 15 億美元邀約的 Andrew Tulloch 是誰?)

今年 3 月,公司也宣布與 Nvidia 合作部署至少一吉瓦的新世代 Vera Rubin 系統,並擴大與 Google Cloud 的合作,推進前沿模型訓練與強化學習研究。

這篇文章 百億新創 Thinking Machines 發表即時互動 AI 模型,主打「邊說邊聽邊作業」 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

印度 AI 工作機會上升 15-20%,部長在 CII 峰會表示

印度聯合國電子與資訊科技部長阿什維尼·瓦伊斯納(Ashwini Vaishnaw)在 CII 年度商業高峰會的發言中表示,根據來自資訊科技產業的回饋,與 AI 相關的工作機會正以 15% 至 20% 的幅度成長。他敦促企業與 Nasscom 合作,為新技術培訓人才,因為資訊科技產業正經歷轉型。部長也強調了重大投資承諾與基礎建設擴建計畫,目標是將印度定位為全球 AI 與資料中心樞紐。 資料中心投資與稅收優惠 瓦伊斯納表示,截至 2047 年的資料中心稅務減免,正在吸引約 2000 億美元的投資。根據 YourStory 的分析,該稅務優惠適用於向印度境外出售服務所產生的營收之境外雲端供應商,但前提是工作負載是在印度的資料中心運行。於印度境內出售的服務必須透過在當地註冊成立的轉售商進行轉售,且須繳納標準的印度稅。 根據來源報導,主要科技公司的已確認投資承諾包括:Google 分配 150 億美元、微軟(Microsoft)截至 2029 年投入 175 億美元,以及 Amazon 到 2030 年投入 350 億美元。 基礎建設與製造擴張 部長宣布,印度計劃建置三條海底電纜網路,連接澳洲與

Crypto Frontier3分鐘前

OpenAI 預計在 2030 年前透過新協議節省 970 億美元的 Microsoft 付款

根據 The Information 的說法,OpenAI 預計在修訂後的合作協議下,於 2030 年前可為微軟節省約 970 億美元的款項,該協議是去年 10 月協商完成的。CFO Sarah Friar 在告知投資人時表示,公司預期將與所有商業合作夥伴(包括微軟)分享營收的 8-10%,低於目前的 20%。

GateNews17分鐘前

南韓總統府澄清:AI 股息相關評論為官員個人觀點

根據 Glontech,南韓總統府一名官員今天表示,總統政策室主任金永範(Kim Yong-beom)關於使用人工智慧(AI)收入來發放「公民股息(citizens dividend)」的相關言論,僅代表他個人的意見。該官員指出,金的相關社群媒體貼文與任何總統府內部的討論或審議皆無關。

GateNews26分鐘前

輝達(Nvidia)執行長黃仁勳強調卡內基美隆大學畢業典禮上的藍領科技工作崗位

根據他在週日於卡內基梅隆大學 2026 畢業典禮上的演說,Nvidia 執行長黃仁勳強調,電工、管道工、鋼鐵工與建築工人最有機會從人工智慧熱潮中獲益。黃仁勳對畢業生說:「AI 給了美國一次重建的機會。這是你們的時代。」他指出,AI 不僅正在創造一個全新的運算產業,還帶來一個新的工業時代,並且龐大的基礎建設需求需要具備技能的工種。

GateNews52分鐘前

攻擊者劫持 TanStack、OpenSearch、Mistral 官方管線,於 5 月 12 日推送 84 個惡意版本

根據 Beating 的監測,5 月 12 日 3:20–3:26(UTC+8)期間,隸屬於 TeamPCP 的攻擊者劫持了 TanStack、Amazon 的 OpenSearch 以及 Mistral 的官方發布管線,將 84 個惡意套件版本推送至 npm 與 PyPI。受影響的套件包含 @tanstack/react-router(每週下載量 1000 萬+)、@opensearch-project/opensearch(每週下載量 130 萬)、以及 Mistral 的 mistralai client。這些惡意套件透過利用 GitHub Actions 的組態瑕疵來取得合法的臨時發布憑證,從而繞過安全信任機制,使其能取得有效的 SLSA 建置可追溯性簽章。 Socket.dev 的反向分析顯示,即使在套件移除後,蠕蟲仍會透過將程式碼注入 Claude Code 的執行掛鉤(.claude/settings.json)與 VS Code 的工作(task)組態(.vscode/tasks.json)來持續存在。就 Python 套件而言,惡意程式會在匯入時靜默啟動,且不需要呼叫

GateNews1小時前

Ixirpad 與 Cware Labs 合作以支援 AI 與 Web3 初創公司

根據 5 月 11 日的一則公告,Ixirpad 與 Cware Labs 簽署了一項策略合作夥伴關係,以加速 Web3 產業的永續基礎設施發展。Cware Labs 作為一間風投工作室運營,將辨識並支持高潛力的區塊鏈與 AI 專案。此合作旨在透過提供營運指導、策略支援以及接觸開發資源,協助新興公司將早期概念轉化為可供投資、具擴展性的企業。Cware Labs 也將對整合進 Ixirpad 生態系的專案進行盡職調查,重點涵蓋代幣經濟學、合規以及長期營收永續性。

GateNews2小時前
留言
0/400
暫無留言