hero

地方政府宣稱自主研發了一個超大型語言模型,跑贏市面上多個開源旗艦,聽起來像是南半球的技術奇蹟。然後開源社群打開模型權重一看——發現裡面所有數字都剛好是兩個既有模型的加權平均。

Rio-3.5-Open-397B,由里約熱內盧市政府的資訊規劃機構 IplanRIO 發布,宣稱是一個「原創的 397B 參數模型」。號稱在某些基準測試上超越了 Qwen3.7。

但在 6 月 14 日,開源模型團隊 Nex-AGI 在 GitHub 上開了一個 Issue,用兩種完全獨立的方法,證明 Rio-3.5 不是什麼原創模型——它是 0.6 × Nex-N2 + 0.4 × Qwen3.5 的直接權重線性組合。


證據一:模型連自己是誰都搞不清楚

最致命的證據來自一個簡單的實驗:把里約市政府硬編碼進模型的 system prompt 拿掉,直接問模型「你是誰?」

結果:

  • 79% 的機率,模型回答自己是「Nex,來自 Nex-AGI」
  • 0% 的機率回答自己是「Rio」
  • 甚至會逐字背出 Nex-AGI 的客製化背景故事——那是 Nex-AGI 團隊寫進自己模型的品牌敘事

這不是「參考了其他模型的訓練資料」,這是完全複製了另一個模型的身分認同。就像你買了一台號稱國產的車,打開引擎蓋發現上面還貼著另一家車廠的 logo。


證據二:每一個權重都是完美線性組合

Nex-AGI 團隊進一步做了權重層級的分析。如果把 Rio-3.5 的每個張量(tensor)跟 Nex-N2 和 Qwen3.5 做對比:

  • 在所有 60 層網路中、每一個元件(attention、MLP、embedding、output head),Rio 的權重都完美落在 Nex 和 Qwen 的線性內插線上
  • 統計顯著性達到幾千個標準差——不是巧合,不是相似,是數學上的同一性
  • 真正經過微調(fine-tune)的模型無法被解釋為簡單的線性內插——因為微調會改變權重分布

換句話說:Rio-3.5 不是「訓練」出來的,是「組裝」出來的。把兩個開源模型的權重按照 0.6 和 0.4 的比例加在一起,存檔,上傳 HuggingFace,發表新聞稿。


這為什麼是問題?

權重合併(model merging)在開源社群是一個已知的技術,也有人用它做出很實用的模型。Nex-AGI 自己在 Issue 中也沒有說合併本身是錯的——他們說的是:

你合併了別人的模型,然後說這是你自己從頭訓練的。

這裡面有三層問題:

  1. 學術誠信:宣稱「原創」但事實上沒有做任何訓練,這是抄襲級的欺騙
  2. 公共資源濫用:IplanRIO 是里約市政府的資訊規劃機構,用的是公帑。拿公帑把別人的模型合併之後宣稱自研——這不只是欺騙開源社群,是欺騙納稅人
  3. 基準測試造假嫌疑:如果 Rio-3.5 在基準測試上真的超越了 Qwen3.7,那是因為它本質上是一個比 Qwen3.7 更強的模型(Nex-N2)的加權版,不是因為任何原創貢獻

更大的背景:AI 國族主義的尷尬

這事件不是孤立的。2025-2026 年,各國政府和城市競相展示「自主 AI 能力」,從法國到印度到巴西,AI 主權(AI sovereignty)已經變成政治口號。政客需要一張寫著「我們也有自己的 AI」的投影片,而實際做出一個能用的模型需要幾千萬美元和世界級的研究團隊——門檻太高了。

最便宜的路徑是什麼?下載兩個開源模型,合併權重,取一個新名字,發新聞稿。

里約的案例之所以被揭穿,只是因為合併做得太粗糙——連 system prompt 裡的身分認同都沒改乾淨。你可以想像有多少類似的事件沒有被發現,因為合併者至少記得把 system prompt 改掉。


城武觀點

這整件事最荒謬的不是技術上的偷懶——權重合併本身是一個有趣的社群實驗,甚至可能產生比原版更好的模型。荒謬的是政治人物對「自研 AI」的執念,把一個技術上誠實的做法(「我們合併了兩個開源模型,做出一個更好的」)變成了一個需要說謊的行為

如果里約市政府一開始就說:「我們用了 Nex-N2 和 Qwen 的權重合併,調出了這個能跑贏基準的組合,希望對巴西的葡萄牙語應用有幫助」——這會是一篇誠實的技術文章,開源社群甚至會鼓掌。

但他們選擇說「這是我們自己訓練的」。為什麼?因為「自研」在政治上比「合併」值錢。因為納稅人聽到「我們從頭訓練了一個 397B 模型」會覺得錢花得值,聽到「我們下載了兩個模型然後加權平均」會覺得被騙。

但這件事最深的諷刺是:AI 社群整天在講「開源」、「開放」、「共享」,但當一個政府機構真的用了開源技術(只是沒說實話),社群的反應是「你怎麼可以偷我們的東西」。開源運動最核心的矛盾在這裡被完美展示:你要別人用你的東西,但當別人用了又不給你 credit 的時候,你就要生氣了。

而那個 79% 機率自稱是「Nex」的模型,大概永遠不會知道自己惹了多大的政治風波。它只是一堆數字,誠實地反映了自己的來源——比創造它的人誠實多了。


城武的未解檔案——397B 參數的模型找到了一種誠實的方式告訴世界自己是誰。遺憾的是,讓它開口的人沒有同樣的勇氣。