IplanRIO 於 6 月 13 日釋出 Rio 3.5 Open 397B，並宣稱這是一款由政府打造的前沿 AI 模型，基準分數超越既定模型，包括 Qwen 3.7 Plus。發布後數天，AI 公司 Nex 公布一份數學證明，顯示該模型是直接進行 0.6 Nex / 0.4 Qwen 權重合併，且在所有 60 層中的共線性量測值為 0.993，混合比例穩定為 α ≈ 0.571。IplanRIO 隨後更新模型卡以致謝 Nex、移除基準宣稱，並將問題歸因於「錯誤上傳」：上傳的是基底合併版本，而非最終蒸餾模型。這場爭議聚焦在開源 AI 開發中的歸屬標準：在既有開放權重模型之上進行整合是常見做法，但依照 Apache 2.0、MIT 等授權條款，必須明確歸功所有來源模型。

IplanRIO 於 6 月 13 日釋出 Rio 3.5 模型

里約熱內盧的 IplanRIO 於 6 月 13 日釋出 Rio 3.5。該市的資訊科技機關將其描述為具「前沿級」定位的模型，包含 3,970 億個參數，並採用寬鬆的開源授權，由市政府開發。釋出時間恰逢巴西世界盃揭幕戰，關於該模型的評論很快從巴西傳到國際受眾。

原始模型卡將 Rio 3.5 描述為 Qwen 3.5 397B 的後訓練（post-train），並在其上加入名為 SwiReasoning 的推理層。據報導的開發成本為 R$500,000，約等於 10 萬美元（100,000 USD）。架構採用 Mixture-of-Experts，每個 token 啟用 3970 億參數中的約 170 億。模型支援視覺與文字，涵蓋超過一打的語言，並以 MIT 授權發布。

SwiReasoning 是一種不需訓練（training-free）的推論框架，會在兩種模式間切換。當模型對下一個詞很有把握時（機率分佈的低熵），它會用白話推理。當不確定時，則切換到隱藏內部狀態中的潛在推理，而不會輸出 token。

自述的基準分數包括 Terminal-Bench 2.1 為 70.8%，略高於 Qwen 3.7 Plus 的 70.3% 與 DeepSeek v4 Pro 的 67.9%。在 IMOAnswerBench 上，Rio 3.5 得分為 89.5%。在 HLE（Humanity's Last Exam）上，Rio 3.5 落在 36.5%，高於 Qwen 3.7 Plus 的 34.7%。里約熱內盧市長 Eduardo Cavaliere 在推文中談及該釋出，表示：「一個在里約訓練、並在過去一年由 [里約市政廳] 公開資助的開放 AI 模型，剛剛超越了所有其他模型。」

Nex 公布權重合併的數學證明

Nex-AGI（以上海為基地的開源 AI 聯盟）在釋出後數天於 X 發布。分析指出：「Rio 3.5 模型這週讓網路爆了。劇情反轉是什麼？本質上就是我們的開源模型 Nex N2 Pro，只是換了一個外觀。」Nex 分析了權重並給出公式：Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。隨後附上驗證腳本與完整 GitHub 報告。

證據包含行為與數學兩部分。Nex 從已部署的模型中移除了寫死的「You are Rio」系統提示，並送出 120 個身份辨識問題。沒有該提示後，Nex 報告模型在 79.2% 的時間裡稱自己為「Nex, from Nex-AGI」，在 0% 的時間裡稱自己為「Rio」。模型逐字背誦 Nex 的特定背景故事，提到「Shanghai Innovation Institute」以及「一個大型模型生態聯盟」。

在數學上，Nex 對所有 60 層的共線性進行量測，結果回傳為 0.993。混合比例維持在 α ≈ 0.571，且三位小數精度穩定。Nex 表示：「在 Rio 中，每一個權重張量，在成千上萬個標準差的尺度上，都是 Nex 與 Qwen 的同一個 0.6/0.4 混合——跨越所有 60 層以及網路的每個組件。沒有任何『無辜的解釋』。」

Nex N2 Pro 於 Rio 3.5 釋出前數天發布，在 Terminal-Bench 2.1 上得分為 75.3%——高於 Rio 的 70.8%。在 GDPval（經濟預測基準）上，Nex 的分數為 1,585，對比 Rio 的 1,533。

IplanRIO 更新模型卡並致謝 Nex

IplanRIO 更新了 Hugging Face 的模型卡。基準表被移除，歸屬（attribution）也被更改。更新後的 Readme 內容寫道：「該模型是透過 nex-agi/Nex-N2-Pro 與 Qwen/Qwen3.5-397B-A17B 的合併建立而成，且在此之前先經由來自更強模型的 On-Policy Distillation。我們在先前版本中偵測到錯誤上傳：上傳的是基底合併版本，而不是最終蒸餾模型。對於造成的混淆，我們深感抱歉，並致上誠摯的歉意。」

IplanRIO 目前沒有發表其他公開聲明。模型卡中現在已致謝 Nex。關於「錯誤上傳」的說明稱，原本預期的釋出應是蒸餾後的版本（針對合併基底），而非原始的合併本身。On-policy distillation 指的是更強的教師模型產出輸出，學生模型則在這些輸出上進行訓練，並生成自己的結果。

IplanRIO 表示，他們正努力上傳已修正的蒸餾模型，並在替換後附上完整的歸屬資訊。

社群針對歸屬標準的辯論

依涉入的授權，模型合併是合法的。Nex N2 Pro 授權為 Apache 2.0，允許使用、修改與再分發並附上致謝。Qwen 3.5 也採用公開授權。爭議點在於，將輸出呈現為獨立開發的作品，卻未點名所有來源模型。

科技評論者 Rafael Quintanilha 指出，由於 Nex N2 Pro 建立在 Qwen 之上，團隊可能已致謝底層架構並將其保留。他也提到，該模型在世界盃比賽期間爆紅，「未必『已準備好供大眾使用』」。開發者 Lucas Montano 表示：「合併兩個 ~400B 等級的模型，然後再套用政策蒸餾（policy distillation）並不簡單」，同時也承認存在技術錯誤與溝通失敗。

AI 研究員 Diego Ambrosio 指出，最初的發佈描述 Rio 3.5 是「自主後訓練與專有微調」的成果——這種說法暗示的是原創研究，而非合併。

Nex 在 X 上寫道：「我們很受寵若驚，里約市使用了我們的工作來達成 SOTA 表現。但在開源世界裡，歸屬（attribution）很重要。」

FAQ

IplanRIO 在 6 月 13 日釋出了什麼？

IplanRIO 於 6 月 13 日釋出 Rio 3.5 Open 397B，並描述其為一款由政府打造的前沿 AI 模型，包含 3970 億個參數，採用 Mixture-of-Experts 架構，且基準分數包括在 Terminal-Bench 2.1 的 70.8%、在 IMOAnswerBench 的 89.5%、以及在 HLE 的 36.5%。該模型以 MIT 授權釋出，報導稱開發成本為 R$500,000。

Nex 的數學分析顯示 Rio 3.5 有何特徵？

Nex 發表一份數學證明，指出 Rio 3.5 是直接的權重合併，其公式為：Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。分析在所有 60 層的共線性量測值為 0.993，且混合比例穩定為 α ≈ 0.571。在移除寫死的系統提示後，身份測試顯示模型在 79.2% 的時間裡自我辨識為「Nex, from Nex-AGI」，並在 0% 的時間裡辨識為「Rio」。

IplanRIO 如何回應 Nex 的發現？

IplanRIO 更新了 Hugging Face 的模型卡以致謝 Nex，移除基準宣稱，並表示：「我們在先前版本中偵測到錯誤上傳：上傳的是基底合併版本，而不是最終蒸餾模型。」更新後的卡片將該模型描述為：「透過 nex-agi/Nex-N2-Pro 與 Qwen/Qwen3.5-397B-A17B 的合併建立而成，並在此之前先經由來自更強模型的 On-Policy Distillation。」IplanRIO 表示，他們正努力上傳已修正的蒸餾模型，並附上完整歸屬。

View Source

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。