#OpenAIReleasesGPT-5.5 OpenAI 推出 GPT-5.5:代理智能新時代引領「超級應用」雄心
舊金山 – 在一個令人驚訝的舉動中,重塑人工智能競爭格局,OpenAI 正式推出了 GPT-5.5。
在 GPT-5.4 發布僅六週後,新模型——代號「Spud」——不僅僅是一次增量升級。OpenAI 總裁 Greg Brockman 描述它為「一種用於實際工作的新型智能」,標誌著從對話聊天機器人到自主「代理」系統的根本轉變,這些系統能夠在無需手把手指導的情況下執行複雜的多步任務。
專注於「行動」,而非僅僅是「聊天」
與前代產品不同,GPT-5.5 被設計為一個代理運行時系統。它旨在規劃、執行、驗證並在數位工具(如代碼解釋器、瀏覽器和辦公軟體)中反覆迭代,以最小的監督完成任務。
早期測試者指出其「概念清晰度」和持久性有顯著提升。在一個值得注意的案例中,該模型在20分鐘內成功將一個包含數百個前端變更的複雜分支合併到一個修改過的主分支中——這是之前的模型未能完成的任務。
基準測試與定價
性能提升立竿見影。在測試複雜命令行工作流程的 Terminal-Bench 2.0 中,GPT-5.5 得分 82.7%,超越了 Claude Opus 4.7 的 69.4%。在知識工作方面,GDPval 得分達到 84.9%,領先。
然而,這種強大也伴隨著高昂的成本。OpenAI 將