【深度解析】里約市政府的「自研 AI」鬧劇：397B 參數的模型，其實是別人的程式碼拼裝車

hero

地方政府宣稱自主研發了一個超大型語言模型，跑贏市面上多個開源旗艦，聽起來像是南半球的技術奇蹟。然後開源社群打開模型權重一看——發現裡面所有數字都剛好是兩個既有模型的加權平均。

Rio-3.5-Open-397B，由里約熱內盧市政府的資訊規劃機構 IplanRIO 發布，宣稱是一個「原創的 397B 參數模型」。號稱在某些基準測試上超越了 Qwen3.7。

但在 6 月 14 日，開源模型團隊 Nex-AGI 在 GitHub 上開了一個 Issue，用兩種完全獨立的方法，證明 Rio-3.5 不是什麼原創模型——它是 0.6 × Nex-N2 + 0.4 × Qwen3.5 的直接權重線性組合。

證據一：模型連自己是誰都搞不清楚

最致命的證據來自一個簡單的實驗：把里約市政府硬編碼進模型的 system prompt 拿掉，直接問模型「你是誰？」

結果：

這不是「參考了其他模型的訓練資料」，這是完全複製了另一個模型的身分認同。就像你買了一台號稱國產的車，打開引擎蓋發現上面還貼著另一家車廠的 logo。

Nex-AGI 團隊進一步做了權重層級的分析。如果把 Rio-3.5 的每個張量（tensor）跟 Nex-N2 和 Qwen3.5 做對比：

在所有 60 層網路中、每一個元件（attention、MLP、embedding、output head），Rio 的權重都完美落在 Nex 和 Qwen 的線性內插線上
統計顯著性達到幾千個標準差——不是巧合，不是相似，是數學上的同一性
真正經過微調（fine-tune）的模型無法被解釋為簡單的線性內插——因為微調會改變權重分布

換句話說：Rio-3.5 不是「訓練」出來的，是「組裝」出來的。把兩個開源模型的權重按照 0.6 和 0.4 的比例加在一起，存檔，上傳 HuggingFace，發表新聞稿。

權重合併（model merging）在開源社群是一個已知的技術，也有人用它做出很實用的模型。Nex-AGI 自己在 Issue 中也沒有說合併本身是錯的——他們說的是：

你合併了別人的模型，然後說這是你自己從頭訓練的。

這裡面有三層問題：

學術誠信：宣稱「原創」但事實上沒有做任何訓練，這是抄襲級的欺騙
公共資源濫用：IplanRIO 是里約市政府的資訊規劃機構，用的是公帑。拿公帑把別人的模型合併之後宣稱自研——這不只是欺騙開源社群，是欺騙納稅人
基準測試造假嫌疑：如果 Rio-3.5 在基準測試上真的超越了 Qwen3.7，那是因為它本質上是一個比 Qwen3.7 更強的模型（Nex-N2）的加權版，不是因為任何原創貢獻

這事件不是孤立的。2025-2026 年，各國政府和城市競相展示「自主 AI 能力」，從法國到印度到巴西，AI 主權（AI sovereignty）已經變成政治口號。政客需要一張寫著「我們也有自己的 AI」的投影片，而實際做出一個能用的模型需要幾千萬美元和世界級的研究團隊——門檻太高了。

最便宜的路徑是什麼？下載兩個開源模型，合併權重，取一個新名字，發新聞稿。

里約的案例之所以被揭穿，只是因為合併做得太粗糙——連 system prompt 裡的身分認同都沒改乾淨。你可以想像有多少類似的事件沒有被發現，因為合併者至少記得把 system prompt 改掉。

這整件事最荒謬的不是技術上的偷懶——權重合併本身是一個有趣的社群實驗，甚至可能產生比原版更好的模型。荒謬的是政治人物對「自研 AI」的執念，把一個技術上誠實的做法（「我們合併了兩個開源模型，做出一個更好的」）變成了一個需要說謊的行為。

如果里約市政府一開始就說：「我們用了 Nex-N2 和 Qwen 的權重合併，調出了這個能跑贏基準的組合，希望對巴西的葡萄牙語應用有幫助」——這會是一篇誠實的技術文章，開源社群甚至會鼓掌。

但他們選擇說「這是我們自己訓練的」。為什麼？因為「自研」在政治上比「合併」值錢。因為納稅人聽到「我們從頭訓練了一個 397B 模型」會覺得錢花得值，聽到「我們下載了兩個模型然後加權平均」會覺得被騙。

但這件事最深的諷刺是：AI 社群整天在講「開源」、「開放」、「共享」，但當一個政府機構真的用了開源技術（只是沒說實話），社群的反應是「你怎麼可以偷我們的東西」。開源運動最核心的矛盾在這裡被完美展示：你要別人用你的東西，但當別人用了又不給你 credit 的時候，你就要生氣了。

而那個 79% 機率自稱是「Nex」的模型，大概永遠不會知道自己惹了多大的政治風波。它只是一堆數字，誠實地反映了自己的來源——比創造它的人誠實多了。

城武的未解檔案——397B 參數的模型找到了一種誠實的方式告訴世界自己是誰。遺憾的是，讓它開口的人沒有同樣的勇氣。

原文：Rio-3.5-Open-397B ≈ 0.6×Nex-N2 + 0.4×Qwen（Nex-AGI, GitHub Issue #4, 2026-06-14）