
輝達(NVIDIA)執行長黃仁勳在 GTC Taipei 2026 演講中系統闡述了 AI Agent 的架構定義:大語言模型(LLM)負責思考、推理和規劃,外部編排引擎(harness)則如同操作系統,將模型與電子表格、瀏覽器、資料庫等工具連接起來,並管理工作記憶與長期記憶。
AI Agent 的架構定義:大模型加編排引擎
黃仁勳在演講中將 AI Agent 的核心結構分為兩個部分:大語言模型作為「思維中樞」,負責推理和規劃;外部編排引擎充當操作系統角色,將模型與各類工具連接,並同時管理短期工作記憶和長期記憶。
他指出,這一架構代表的是運算模式的根本轉變,而非單純的效率工具升級。現場展示時他提到:「我們這裡用的是 Claude Code,但 Codex 同樣表現出色。」
GTC Taipei 現場的三個確認展示案例
黃仁勳在演講中現場展示了三個 AI Agent 案例:第一,通過自然語言提示詞直接生成完整應用程式代碼;第二,輸入一段文字描述後,Agent 即時生成了包含台北 101 → GTC Taipei 2026 → NVIDIA logo 主題的動態粒子動畫;第三,現場拍攝一張遙控器電池夾缺失的照片,Agent 自動調用 CAD 工具,生成了可直接用於 3D 打印的替換零件文件。
駁斥軟體倒閉論:「現在是做軟件公司最好的時代」
針對市場上流傳的「AI Agent 將令軟體公司倒閉」的說法,黃仁勳明確反駁:「恰恰相反。」他表示,當不再受限於人類數量,海量 Agent 將比人類使用更多軟件工具,「現在是做軟件公司最好的時代」——但前提是軟件必須以 Agent 可直接調用的方式設計和呈現。輝達的 CUDA X 庫全面開放給 Agent 使用,Agent 使用效率甚至超過人類開發者。
常見問題
黃仁勳定義的 AI Agent 與傳統軟件應用有何根本不同?
黃仁勳在 GTC Taipei 2026 定義的 AI Agent 由 LLM(推理規劃)和編排引擎(工具連接+記憶管理)組成。傳統軟件是用戶「啟動-點擊-輸入」,Agent 模式是「向 AI 描述意圖,AI 自動生成代碼、調用工具並輸出結果」,操作主體從人轉移到 AI 本身。
3D 打印遙控器電池夾的案例說明了什麼?
這一現場演示展示了 Agent 的多工具調用能力:Agent 識別照片中的問題(電池夾缺失)、理解需求(需要替換零件)、調用 CAD 工具進行建模,直接輸出可 3D 打印的文件——完成了從問題識別到解決方案的完整工作流,無需人類逐步干預。
CUDA X 全面開放給 Agent 意味著什麼?
黃仁勳宣布輝達的 CUDA X 庫已全面向 AI Agent 開放,且 Agent 的使用效率超過人類開發者。這意味著輝達的核心 AI 加速基礎設施正式擴展至 Agent 開發生態,為開發者提供了更高效的工具調用基礎。