小米大模型負責人：AI 競爭轉向 Agent 時代，自進化是 AGI 關鍵事件

2026-04-27 05:33:31

小米大模型團隊負責人羅福莉於 4 月 24 日在嗶哩嗶哩平台接受深度訪談（影片號：BV1iVoVBgERD），訪談時長 3.5 小時，為其首次以技術負責人身份公開系統性闡述技術觀點。羅福莉稱，大模型競爭賽道已從 Chat 時代轉入 Agent 時代，並指出「自進化」將是未來一年 AGI 關鍵事件。

Chat 時代到 Agent 時代：核心技術判斷

（來源：嗶哩嗶哩）

根據羅福莉在 Bilibili 訪談中的陳述，她指出 2026 年大模型競爭的重心已從通用對話品質轉向在複雜任務中的持續自主執行能力。她在訪談中表示，目前頂尖模型已能在特定任務中自主最佳化，並持續穩定執行 2 至 3 天，不需要人類介入調整。她在訪談中強調，「自進化」能力的突破代表 AI 系統開始具備自我修正能力，並點名 Anthropic 的技術路徑以及 Claude Opus 4.6 等技術變數對整個 AI 生態的影響。

小米算力配比調整與 Pre-train 代差評估

根據羅福莉在訪談中的披露，小米在算力分配策略上已進行重大調整。她說明，業界慣用的算力配比為 Pre-train:Post-train:Inference = 3:5:1，而小米當前策略已調整為 3:1:1，大幅壓縮後訓練比例，同步提升推理階段的資源投入。

她在訪談中解釋，這一轉變源於 Agent RL Scaling 策略的成熟，使後訓練不再需要大量算力堆疊，而推理端資源的提升反映了 Agent 落地場景對即時響應能力的需求。

對於國內大模型的 Pre-train 代差問題，羅福莉在訪談中表示，這一差距已從過去的 3 年縮短至數月，當前的策略重心正向 Agent RL Scaling 移動。羅福莉的職涯歷程涵蓋阿里達摩院、幻方量化及 DeepSeek（DeepSeek-V2 核心開發者），於 2025 年 11 月加入小米。

MiMo-V2 系列技術規格與開源排名

根據小米官方於 2026 年 3 月 19 日發布的 MiMo-V2 系列公告，此次一次發布三款模型：

MiMo-V2-Pro：兆總參數，啟用參數 42B，混合注意力架構，支援百萬上下文，任務完成率 81%

MiMo-V2-Omni：全模態 Agent 場景

MiMo-V2-TTS：語音合成場景

根據公告，已開源的 MiMo-V2-Flash 在全球開源模型排行榜位列第二，推理速度達 DeepSeek-V3.2 的 3 倍。

常見問題

羅福莉如何定義「自進化」，為何認為其是 AGI 最關鍵事件？

根據羅福莉 2026 年 4 月 24 日在 Bilibili 的訪談陳述（BV1iVoVBgERD），她在訪談中指出，目前頂尖模型已能在特定任務中自主最佳化並穩定執行 2 至 3 天而無需人類介入，並將「自進化」定性為未來一年 AGI 發展最關鍵的事件。

小米在算力配比上做了哪些具體調整，背後邏輯為何？

根據羅福莉在訪談中的披露，小米的算力配比已從業界慣用的 Pre-train:Post-train:Inference = 3:5:1 調整為 3:1:1，大幅壓縮後訓練比例；她解釋這一調整源於 Agent RL Scaling 策略成熟後後訓練效率提升，以及 Agent 落地場景對推理端即時響應能力的需求。

MiMo-V2-Flash 的開源排名與速度表現如何？

根據小米 2026 年 3 月 19 日發布的官方公告，已開源的 MiMo-V2-Flash 在全球開源模型排行榜位列第二，推理速度達 DeepSeek-V3.2 的 3 倍，旗艦版 MiMo-V2-Pro 的任務完成率為 81%。

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。