IplanRIO 於 6 月 13 日釋出 Rio 3.5 Open 397B,並宣稱這是一款由政府打造的前沿 AI 模型,基準分數超越既定模型,包括 Qwen 3.7 Plus。發布後數天,AI 公司 Nex 公布一份數學證明,顯示該模型是直接進行 0.6 Nex / 0.4 Qwen 權重合併,且在所有 60 層中的共線性量測值為 0.993,混合比例穩定為 α ≈ 0.571。IplanRIO 隨後更新模型卡以致謝 Nex、移除基準宣稱,並將問題歸因於「錯誤上傳」:上傳的是基底合併版本,而非最終蒸餾模型。這場爭議聚焦在開源 AI 開發中的歸屬標準:在既有開放權重模型之上進行整合是常見做法,但依照 Apache 2.0、MIT 等授權條款,必須明確歸功所有來源模型。
里約熱內盧的 IplanRIO 於 6 月 13 日釋出 Rio 3.5。該市的資訊科技機關將其描述為具「前沿級」定位的模型,包含 3,970 億個參數,並採用寬鬆的開源授權,由市政府開發。釋出時間恰逢巴西世界盃揭幕戰,關於該模型的評論很快從巴西傳到國際受眾。
原始模型卡將 Rio 3.5 描述為 Qwen 3.5 397B 的後訓練(post-train),並在其上加入名為 SwiReasoning 的推理層。據報導的開發成本為 R$500,000,約等於 10 萬美元(100,000 USD)。架構採用 Mixture-of-Experts,每個 token 啟用 3970 億參數中的約 170 億。模型支援視覺與文字,涵蓋超過一打的語言,並以 MIT 授權發布。
SwiReasoning 是一種不需訓練(training-free)的推論框架,會在兩種模式間切換。當模型對下一個詞很有把握時(機率分佈的低熵),它會用白話推理。當不確定時,則切換到隱藏內部狀態中的潛在推理,而不會輸出 token。
自述的基準分數包括 Terminal-Bench 2.1 為 70.8%,略高於 Qwen 3.7 Plus 的 70.3% 與 DeepSeek v4 Pro 的 67.9%。在 IMOAnswerBench 上,Rio 3.5 得分為 89.5%。在 HLE(Humanity's Last Exam)上,Rio 3.5 落在 36.5%,高於 Qwen 3.7 Plus 的 34.7%。里約熱內盧市長 Eduardo Cavaliere 在推文中談及該釋出,表示:「一個在里約訓練、並在過去一年由 [里約市政廳] 公開資助的開放 AI 模型,剛剛超越了所有其他模型。」
Nex-AGI(以上海為基地的開源 AI 聯盟)在釋出後數天於 X 發布。分析指出:「Rio 3.5 模型這週讓網路爆了。劇情反轉是什麼?本質上就是我們的開源模型 Nex N2 Pro,只是換了一個外觀。」Nex 分析了權重並給出公式:Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。隨後附上驗證腳本與完整 GitHub 報告。
證據包含行為與數學兩部分。Nex 從已部署的模型中移除了寫死的「You are Rio」系統提示,並送出 120 個身份辨識問題。沒有該提示後,Nex 報告模型在 79.2% 的時間裡稱自己為「Nex, from Nex-AGI」,在 0% 的時間裡稱自己為「Rio」。模型逐字背誦 Nex 的特定背景故事,提到「Shanghai Innovation Institute」以及「一個大型模型生態聯盟」。
在數學上,Nex 對所有 60 層的共線性進行量測,結果回傳為 0.993。混合比例維持在 α ≈ 0.571,且三位小數精度穩定。Nex 表示:「在 Rio 中,每一個權重張量,在成千上萬個標準差的尺度上,都是 Nex 與 Qwen 的同一個 0.6/0.4 混合——跨越所有 60 層以及網路的每個組件。沒有任何『無辜的解釋』。」
Nex N2 Pro 於 Rio 3.5 釋出前數天發布,在 Terminal-Bench 2.1 上得分為 75.3%——高於 Rio 的 70.8%。在 GDPval(經濟預測基準)上,Nex 的分數為 1,585,對比 Rio 的 1,533。
IplanRIO 更新了 Hugging Face 的模型卡。基準表被移除,歸屬(attribution)也被更改。更新後的 Readme 內容寫道:「該模型是透過 nex-agi/Nex-N2-Pro 與 Qwen/Qwen3.5-397B-A17B 的合併建立而成,且在此之前先經由來自更強模型的 On-Policy Distillation。我們在先前版本中偵測到錯誤上傳:上傳的是基底合併版本,而不是最終蒸餾模型。對於造成的混淆,我們深感抱歉,並致上誠摯的歉意。」
IplanRIO 目前沒有發表其他公開聲明。模型卡中現在已致謝 Nex。關於「錯誤上傳」的說明稱,原本預期的釋出應是蒸餾後的版本(針對合併基底),而非原始的合併本身。On-policy distillation 指的是更強的教師模型產出輸出,學生模型則在這些輸出上進行訓練,並生成自己的結果。
IplanRIO 表示,他們正努力上傳已修正的蒸餾模型,並在替換後附上完整的歸屬資訊。
依涉入的授權,模型合併是合法的。Nex N2 Pro 授權為 Apache 2.0,允許使用、修改與再分發並附上致謝。Qwen 3.5 也採用公開授權。爭議點在於,將輸出呈現為獨立開發的作品,卻未點名所有來源模型。
科技評論者 Rafael Quintanilha 指出,由於 Nex N2 Pro 建立在 Qwen 之上,團隊可能已致謝底層架構並將其保留。他也提到,該模型在世界盃比賽期間爆紅,「未必『已準備好供大眾使用』」。開發者 Lucas Montano 表示:「合併兩個 ~400B 等級的模型,然後再套用政策蒸餾(policy distillation)並不簡單」,同時也承認存在技術錯誤與溝通失敗。
AI 研究員 Diego Ambrosio 指出,最初的發佈描述 Rio 3.5 是「自主後訓練與專有微調」的成果——這種說法暗示的是原創研究,而非合併。
Nex 在 X 上寫道:「我們很受寵若驚,里約市使用了我們的工作來達成 SOTA 表現。但在開源世界裡,歸屬(attribution)很重要。」
IplanRIO 在 6 月 13 日釋出了什麼?
IplanRIO 於 6 月 13 日釋出 Rio 3.5 Open 397B,並描述其為一款由政府打造的前沿 AI 模型,包含 3970 億個參數,採用 Mixture-of-Experts 架構,且基準分數包括在 Terminal-Bench 2.1 的 70.8%、在 IMOAnswerBench 的 89.5%、以及在 HLE 的 36.5%。該模型以 MIT 授權釋出,報導稱開發成本為 R$500,000。
Nex 的數學分析顯示 Rio 3.5 有何特徵?
Nex 發表一份數學證明,指出 Rio 3.5 是直接的權重合併,其公式為:Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。分析在所有 60 層的共線性量測值為 0.993,且混合比例穩定為 α ≈ 0.571。在移除寫死的系統提示後,身份測試顯示模型在 79.2% 的時間裡自我辨識為「Nex, from Nex-AGI」,並在 0% 的時間裡辨識為「Rio」。
IplanRIO 如何回應 Nex 的發現?
IplanRIO 更新了 Hugging Face 的模型卡以致謝 Nex,移除基準宣稱,並表示:「我們在先前版本中偵測到錯誤上傳:上傳的是基底合併版本,而不是最終蒸餾模型。」更新後的卡片將該模型描述為:「透過 nex-agi/Nex-N2-Pro 與 Qwen/Qwen3.5-397B-A17B 的合併建立而成,並在此之前先經由來自更強模型的 On-Policy Distillation。」IplanRIO 表示,他們正努力上傳已修正的蒸餾模型,並附上完整歸屬。
相關新聞
IREN 併購西班牙本土的 Nostrum Group,取得 490 MW 用於 AI 資料中心供電
AMD 超越 $900B 市值,Ryzen AI Halo 挑戰 Nvidia DGX 的火花
AI 領袖在致遠會議上辯論模型差異化與中國「具身智能」的機會
ChatGPT Pro 在 Semianalysis 訂閱測試中交付 1.4 萬美元的 AI 價值
Bittensor 在 Anthropic AI 模型停機令後上漲 16%