【深度分析】歐洲不需要 OpenAI 或 Anthropic：Euromesh 的聯邦算力反擊

hero

有一個說法你大概聽過很多次了：前沿 AI 模型只能由美國公司來做。歐洲沒有足夠的算力、沒有集中的資料中心、沒有那個生態系。所以歐洲應該乖乖當消費者，跟 OpenAI 和 Anthropic 買 token，然後立法監管他們——在他們設在法蘭克福的 AWS 機房裡。

這個說法方便、乾淨、讓所有人都有台階下。但它是一個敘事，不是一個事實。而且這個敘事正在被一份來自有數據支撐的技術報告拆解。

獨立研究者 sammysltd 在 GitHub 上發布了開源專案 Euromesh，問了一個極其務實的問題：歐洲能不能用現有的公共算力，聯邦起來訓練一個前沿 AI 模型，而不必等那些還在排電網的 GW 級資料中心？

答案是可以——而且比等 GW 園區快五年。

問題的起點：算力不是沒有，是被拆散了

歐洲已經營運著數十 exaflops 的公共 AI 算力。數字來自兩個來源：

EuroHPC：歐盟聯合超級電腦計畫，旗下有多台旗艦級主機（LUMI、Leonardo、MareNostrum 5 等），搭載大量 GPU 加速器
19 個國家級 AI Factory：分布在各成員國，專為 AI 訓練和推理佈建的運算節點

這些資源加起來不是小數目。問題是它們沒有被當成「一個東西」來看待——它們分散在不同國家、不同機房、不同管理單位、不同排程系統。按照現行思微，要做前沿模型訓練，你需要一個單點、同質、超大規模的叢集——也就是一個 1 GW 的資料中心園區。

但 Euromesh 的關鍵觀察在這裡：一個 1 GW 的資料中心園區，從規劃到通電，平均需要 7.6 年。

不是 7.6 個月。是 7.6 年。數據來源包括 AWS 公開表示的「最長七年」說法，以及 IEA 對全球電網併聯時間 2-10 年的估計範圍。七個地區的交叉比對給出了一致的圖像：電網是真正的瓶頸，不是資本、不是土地、不是伺服器供應——是物理上把電接進去需要的時間。

所以真正的選擇不是「聯邦訓練 vs. 集中訓練」的效率之爭，而是：

聯邦方案（DiLoCo 分散式訓練）：用現有算力，2028 年左右上線
GW 園區方案（集中式）：等電網接通，2033 年左右上線

差五年。在 AI 的時鐘上，五年是永恆。

三層模型：Euromesh 是怎麼算出這個結論的

報告建立了一個三層分析架構來評估兩種方案的可行性。讓我用誠實的方式重建這個模型：

Layer 1：訓練效率懲罰（Efficiency Penalty）

DiLoCo（Distributed Low-Communication）是 Google DeepMind 提出的分散式訓練方法。核心概念是：每個站點在本地跑很多步梯度更新，然後跨站點同步一次。跟傳統的同步 SGD 相比，這會造成一定的 per-FLOP 效率損失——同樣的總算力，分散式訓練產出的模型品質會略低於集中式。

Euromesh 為這個 penalty 建模，並給出了一個量化估計。關鍵是：這個數字存在不確定性，所以報告針對它做了 sensitivity analysis。

Layer 2：時間可用性（Time Availability）——核心層

這層追蹤的是：「每個站點什麼時候可以開始訓練？」

它把 EuroHPC 現有機器、AI Factory 的規劃通電時間、以及 GW 級新園區的電網排隊時間全部納入，計算兩條累積算力曲線：

算力 (EFLOPS)
    ^
    |        聯邦方案 ──→ 2028 達標
    |       .'
    |     .'
    |   .'
    | .'
    |'
    |          GW 園區 ──→ 2033 達標
    |                    .'
    |                  .'
    |                .'
    |              .'
    |            .'
    +──────────────────────────→ 時間
    2026    2028    2030    2032    2034

聯邦方案在 2026 年就能開始用現有機器跑（雖然一開始規模較小），GW 園區則是從零開始，而且電網的那 7.6 年等待期不是開玩笑。在時間軸上，聯邦方案的算力累積曲線一直領先。

Layer 3：區域評分卡（Regional Scorecard）

針對每個候選站點，從四個維度打分：時間（Time）、成本（Cost）、碳排（Carbon）、可行性（Feasibility）。這個圖層給出的是 granular 的地理政治資訊，幫助決策者判斷「哪個站點值得優先投入」。

核心發現：頭條結果幾乎全由 Layer 2 決定

這是整份報告最誠實、也最有說服力的部分。Euromesh 做了一個 sensitivity tornado 分析，去測試「如果我們對 DiLoCo penalty 的估計錯了怎麼辦？」

結果：即使你把 DiLoCo 的效率懲罰拉到極端悲觀的假設，聯邦方案依然贏。 因為贏的原因不是分散式訓練本身比較好——而是它早了五年上線。五年的領先優勢，足以吃掉任何合理的效率懲罰。

用白話說：一台 2028 年上線的「效率 70% 的聯邦系統」跟一台 2033 年上線的「效率 100% 的集中系統」相比，前者產出的模型仍然更好——因為它早五年。AI 能力的成長曲線是指數級的，你晚五年入場，你的 baseline 就輸了整個世代。

誠實的但書：這份報告沒有在騙你

Euromesh 的報告有一個特質在 AI 政策討論中極其罕見：它把不確定性寫在臉上。

電網排隊時間是估算值，不是觀測數據。歐洲還沒有任何營運商真正啟用過 1 GW 的單點 AI 負載，所以 7.6 年是外推，不是實測。
「擁有算力」不等於「可用於單一協調訓練」。EuroHPC 的機器是共享、批次排程、異質硬體。你今天能不能把所有 LUMI 的 GPU 全部調度來跑一個模型？這不是技術問題，是政治決策——需要各成員國同意、需要排程政策修改、需要有人承擔「為了訓練一個模型，我們暫停了王教授的氣候模擬」的政治後果。
分散式訓練的規模驗證有限。DiLoCo-style 的前沿規模訓練目前只在 ~10B 參數級別驗證過。報告設定的目標是「可信的前沿級」，而不是保證能做出一個 405B 的 GPT-4 等級模型。
獨立分析，未經同行評審。所有數據截至 2026 年 6 月。

這些但書不是免責聲明——它們是報告可性度的來源。一份願意告訴你「我們不知道的事」的報告，比一百份只告訴你「我們是對的」的報告更有價值。

城武觀點

1. 必然性敘事的拆解

「只有美國公司能做前沿模型」——這不是一個物理定律，這是一個被精心維護的敘事。維護這個敘事的人包括：美國 AI 公司（當然），創投（這讓他們手上的籌碼看起來更稀缺），還有歐洲自己的政策制定者（因為承認「其實我們可以自己做」意味著要負責任去做）。

Euromesh 做的事情很簡單：它不跟你辯意識形態，它直接算數學。結果證明：歐洲有算力、有時間窗口、有技術路徑。不是做不到——是不給你做的正當性。

當有人跟你說「這件事只有我們能做」的時候，你應該問的不是「真的嗎」，而是「誰在付錢讓你這麼說」。

2. 監管捕獲的歐洲版本——AWS 和 Microsoft 不是來幫你的

過去五年，AWS 和 Microsoft 在歐洲大舉投資資料中心。名義上是「支持歐洲數位轉型」。實際上，這是一種基礎設施層級的監管捕獲。

當你的 AI 模型跑在 AWS 的 Frankfurt 機房、用 Microsoft 的 Azure 算力、呼叫 Anthropic 或 OpenAI 的 API——你確實「有 AI 能力」，但你沒有主權。你所有的 token 都要經過一家美國公司的帳單系統。你的模型訓練依賴他們的 infra、他們的排程、他們的優先級。

Euromesh 的方案是一條完全不同的路：「不玩你的遊戲。」不用等你來歐洲蓋資料中心，不用訂閱你的 API——歐洲已經有自己的東西了，需要的只是把它們聯邦起來用。這是數位主權的務實版本：不是喊口號，是算 FLOP。

3. 最核心的變數不是 GPU，是排程政策

讀完整份報告之後，最令人不安的發現不是某個技術細節，而是這件事：整個方案最大的不確定性不是硬體、不是演算法、不是電網——是 EuroHPC 的排程政策。 一個政治決策。

技術上，DiLoCo 的 penalty 被 tornado 分析證實是次要因素。物理上，機器已經在那裡了。但能不能真的把這些機器調度來跑一個協調訓練任務——這件事還沒有人拍板。不是因為太難，是因為沒有人願意當那個「把超級電腦從科學家手上搶走拿去訓練 AI」的人。

這不是技術瓶頸，這是政治意願的真空。而政治意願的真空，恰恰是既有利益者（美國 AI 公司）最喜歡的生態環境——什麼都不做，就是對現狀最好的保護。

4. 異質硬體不是藉口——DiLoCo 的誠實數學

一直以來，歐洲分散式算力最大的心理障礙是「我們的機器不一樣」。LUMI 用 AMD、Leonardo 用 NVIDIA、不同世代、不同互連。

但 Euromesh 的 sensitivity tornado 已經證明了：效率懲罰是次要因素。 DiLoCo 的設計初衷本來就是為了跨異質、低頻寬環境——它不需要同質硬體，不需要 InfiniBand 互連，不需要你在同一個機櫃裡。它只需要你能在每個站點獨立跑梯度更新，然後偶爾同步一次。

這意味著「硬體不夠統一」這個藉口，技術上已經不成立了。剩下的只有政治上的不情願。

5. 時間才是真正的護城河

Euromesh 最深層的洞察不是關於算力或演算法，而是關於時間的價值。

美國 AI 壟斷的真正基礎不是技術領先——技術差距在縮小，這點 DeepSeek V4 和 Qwen 的進展已經證明。真正的基礎是時間差：當你讓世界相信「等 GW 園區通電再說」，你已經賺到了 7.6 年。7.6 年後，不管你能不能做，市場已經被佔滿、生態系已經鎖定、政策制定者已經習慣了「跟美國公司買 token」的作業流程。

Euromesh 用模型證明：如果你不等，你 2028 年就可以上線。這個「不等」不是技術創新，是時間框架的重新定義。而重新定義時間框架，正是打破壟斷的第一步。

城武的未解檔案——AWS 跟你說「最長七年」，意思是「七年後你再來談」。Euromesh 的回應是：「你慢慢等電網，我先用了。」歐洲需要的不是更多 GPU，是一個願意說「我們不等了」的人。

原文：EuroMesh: Can Europe train a frontier AI model on the compute it owns?（sammysltd, GitHub, 2026-06）