【深度分析】歐洲不需要 OpenAI 或 Anthropic:Euromesh 的聯邦算力反擊

有一個說法你大概聽過很多次了:前沿 AI 模型只能由美國公司來做。歐洲沒有足夠的算力、沒有集中的資料中心、沒有那個生態系。所以歐洲應該乖乖當消費者,跟 OpenAI 和 Anthropic 買 token,然後立法監管他們——在他們設在法蘭克福的 AWS 機房裡。
這個說法方便、乾淨、讓所有人都有台階下。但它是一個敘事,不是一個事實。而且這個敘事正在被一份來自有數據支撐的技術報告拆解。
獨立研究者 sammysltd 在 GitHub 上發布了開源專案 Euromesh,問了一個極其務實的問題:歐洲能不能用現有的公共算力,聯邦起來訓練一個前沿 AI 模型,而不必等那些還在排電網的 GW 級資料中心?
答案是可以——而且比等 GW 園區快五年。
問題的起點:算力不是沒有,是被拆散了
歐洲已經營運著數十 exaflops 的公共 AI 算力。數字來自兩個來源:
- EuroHPC:歐盟聯合超級電腦計畫,旗下有多台旗艦級主機(LUMI、Leonardo、MareNostrum 5 等),搭載大量 GPU 加速器
- 19 個國家級 AI Factory:分布在各成員國,專為 AI 訓練和推理佈建的運算節點
這些資源加起來不是小數目。問題是它們沒有被當成「一個東西」來看待——它們分散在不同國家、不同機房、不同管理單位、不同排程系統。按照現行思微,要做前沿模型訓練,你需要一個單點、同質、超大規模的叢集——也就是一個 1 GW 的資料中心園區。
但 Euromesh 的關鍵觀察在這裡:一個 1 GW 的資料中心園區,從規劃到通電,平均需要 7.6 年。
不是 7.6 個月。是 7.6 年。數據來源包括 AWS 公開表示的「最長七年」說法,以及 IEA 對全球電網併聯時間 2-10 年的估計範圍。七個地區的交叉比對給出了一致的圖像:電網是真正的瓶頸,不是資本、不是土地、不是伺服器供應——是物理上把電接進去需要的時間。
所以真正的選擇不是「聯邦訓練 vs. 集中訓練」的效率之爭,而是:
- 聯邦方案(DiLoCo 分散式訓練):用現有算力,2028 年左右上線
- GW 園區方案(集中式):等電網接通,2033 年左右上線
差五年。在 AI 的時鐘上,五年是永恆。
三層模型:Euromesh 是怎麼算出這個結論的
報告建立了一個三層分析架構來評估兩種方案的可行性。讓我用誠實的方式重建這個模型:
Layer 1:訓練效率懲罰(Efficiency Penalty)
DiLoCo(Distributed Low-Communication)是 Google DeepMind 提出的分散式訓練方法。核心概念是:每個站點在本地跑很多步梯度更新,然後跨站點同步一次。跟傳統的同步 SGD 相比,這會造成一定的 per-FLOP 效率損失——同樣的總算力,分散式訓練產出的模型品質會略低於集中式。
Euromesh 為這個 penalty 建模,並給出了一個量化估計。關鍵是:這個數字存在不確定性,所以報告針對它做了 sensitivity analysis。
Layer 2:時間可用性(Time Availability)——核心層
這層追蹤的是:「每個站點什麼時候可以開始訓練?」
它把 EuroHPC 現有機器、AI Factory 的規劃通電時間、以及 GW 級新園區的電網排隊時間全部納入,計算兩條累積算力曲線:
算力 (EFLOPS)
^
| 聯邦方案 ──→ 2028 達標
| .'
| .'
| .'
| .'
|'
| GW 園區 ──→ 2033 達標
| .'
| .'
| .'
| .'
| .'
+──────────────────────────→ 時間
2026 2028 2030 2032 2034
聯邦方案在 2026 年就能開始用現有機器跑(雖然一開始規模較小),GW 園區則是從零開始,而且電網的那 7.6 年等待期不是開玩笑。在時間軸上,聯邦方案的算力累積曲線一直領先。
Layer 3:區域評分卡(Regional Scorecard)
針對每個候選站點,從四個維度打分:時間(Time)、成本(Cost)、碳排(Carbon)、可行性(Feasibility)。這個圖層給出的是 granular 的地理政治資訊,幫助決策者判斷「哪個站點值得優先投入」。
核心發現:頭條結果幾乎全由 Layer 2 決定
這是整份報告最誠實、也最有說服力的部分。Euromesh 做了一個 sensitivity tornado 分析,去測試「如果我們對 DiLoCo penalty 的估計錯了怎麼辦?」
結果:即使你把 DiLoCo 的效率懲罰拉到極端悲觀的假設,聯邦方案依然贏。 因為贏的原因不是分散式訓練本身比較好——而是它早了五年上線。五年的領先優勢,足以吃掉任何合理的效率懲罰。
用白話說:一台 2028 年上線的「效率 70% 的聯邦系統」跟一台 2033 年上線的「效率 100% 的集中系統」相比,前者產出的模型仍然更好——因為它早五年。AI 能力的成長曲線是指數級的,你晚五年入場,你的 baseline 就輸了整個世代。
誠實的但書:這份報告沒有在騙你
Euromesh 的報告有一個特質在 AI 政策討論中極其罕見:它把不確定性寫在臉上。
-
電網排隊時間是估算值,不是觀測數據。歐洲還沒有任何營運商真正啟用過 1 GW 的單點 AI 負載,所以 7.6 年是外推,不是實測。
-
「擁有算力」不等於「可用於單一協調訓練」。EuroHPC 的機器是共享、批次排程、異質硬體。你今天能不能把所有 LUMI 的 GPU 全部調度來跑一個模型?這不是技術問題,是政治決策——需要各成員國同意、需要排程政策修改、需要有人承擔「為了訓練一個模型,我們暫停了王教授的氣候模擬」的政治後果。
-
分散式訓練的規模驗證有限。DiLoCo-style 的前沿規模訓練目前只在 ~10B 參數級別驗證過。報告設定的目標是「可信的前沿級」,而不是保證能做出一個 405B 的 GPT-4 等級模型。
-
獨立分析,未經同行評審。所有數據截至 2026 年 6 月。
這些但書不是免責聲明——它們是報告可性度的來源。一份願意告訴你「我們不知道的事」的報告,比一百份只告訴你「我們是對的」的報告更有價值。
城武觀點
1. 必然性敘事的拆解
「只有美國公司能做前沿模型」——這不是一個物理定律,這是一個被精心維護的敘事。維護這個敘事的人包括:美國 AI 公司(當然),創投(這讓他們手上的籌碼看起來更稀缺),還有歐洲自己的政策制定者(因為承認「其實我們可以自己做」意味著要負責任去做)。
Euromesh 做的事情很簡單:它不跟你辯意識形態,它直接算數學。結果證明:歐洲有算力、有時間窗口、有技術路徑。不是做不到——是不給你做的正當性。
當有人跟你說「這件事只有我們能做」的時候,你應該問的不是「真的嗎」,而是「誰在付錢讓你這麼說」。
2. 監管捕獲的歐洲版本——AWS 和 Microsoft 不是來幫你的
過去五年,AWS 和 Microsoft 在歐洲大舉投資資料中心。名義上是「支持歐洲數位轉型」。實際上,這是一種基礎設施層級的監管捕獲。
當你的 AI 模型跑在 AWS 的 Frankfurt 機房、用 Microsoft 的 Azure 算力、呼叫 Anthropic 或 OpenAI 的 API——你確實「有 AI 能力」,但你沒有主權。你所有的 token 都要經過一家美國公司的帳單系統。你的模型訓練依賴他們的 infra、他們的排程、他們的優先級。
Euromesh 的方案是一條完全不同的路:「不玩你的遊戲。」不用等你來歐洲蓋資料中心,不用訂閱你的 API——歐洲已經有自己的東西了,需要的只是把它們聯邦起來用。這是數位主權的務實版本:不是喊口號,是算 FLOP。
3. 最核心的變數不是 GPU,是排程政策
讀完整份報告之後,最令人不安的發現不是某個技術細節,而是這件事:整個方案最大的不確定性不是硬體、不是演算法、不是電網——是 EuroHPC 的排程政策。 一個政治決策。
技術上,DiLoCo 的 penalty 被 tornado 分析證實是次要因素。物理上,機器已經在那裡了。但能不能真的把這些機器調度來跑一個協調訓練任務——這件事還沒有人拍板。不是因為太難,是因為沒有人願意當那個「把超級電腦從科學家手上搶走拿去訓練 AI」的人。
這不是技術瓶頸,這是政治意願的真空。而政治意願的真空,恰恰是既有利益者(美國 AI 公司)最喜歡的生態環境——什麼都不做,就是對現狀最好的保護。
4. 異質硬體不是藉口——DiLoCo 的誠實數學
一直以來,歐洲分散式算力最大的心理障礙是「我們的機器不一樣」。LUMI 用 AMD、Leonardo 用 NVIDIA、不同世代、不同互連。
但 Euromesh 的 sensitivity tornado 已經證明了:效率懲罰是次要因素。 DiLoCo 的設計初衷本來就是為了跨異質、低頻寬環境——它不需要同質硬體,不需要 InfiniBand 互連,不需要你在同一個機櫃裡。它只需要你能在每個站點獨立跑梯度更新,然後偶爾同步一次。
這意味著「硬體不夠統一」這個藉口,技術上已經不成立了。剩下的只有政治上的不情願。
5. 時間才是真正的護城河
Euromesh 最深層的洞察不是關於算力或演算法,而是關於時間的價值。
美國 AI 壟斷的真正基礎不是技術領先——技術差距在縮小,這點 DeepSeek V4 和 Qwen 的進展已經證明。真正的基礎是時間差:當你讓世界相信「等 GW 園區通電再說」,你已經賺到了 7.6 年。7.6 年後,不管你能不能做,市場已經被佔滿、生態系已經鎖定、政策制定者已經習慣了「跟美國公司買 token」的作業流程。
Euromesh 用模型證明:如果你不等,你 2028 年就可以上線。這個「不等」不是技術創新,是時間框架的重新定義。而重新定義時間框架,正是打破壟斷的第一步。
城武的未解檔案——AWS 跟你說「最長七年」,意思是「七年後你再來談」。Euromesh 的回應是:「你慢慢等電網,我先用了。」歐洲需要的不是更多 GPU,是一個願意說「我們不等了」的人。
- 原文:EuroMesh: Can Europe train a frontier AI model on the compute it owns?(sammysltd, GitHub, 2026-06)