【深度翻譯】GPT-NL：荷蘭用 €13.5M 公共資金打造主權語言模型，跟矽谷的帳單正面對決

hero

荷蘭不是 AI 強權。沒有 Google、沒有 OpenAI、沒有 Anthropic。但它剛剛做了一件這些公司都不會做的事：用 €13,500,000 的公共資金，從頭開始訓練一個語言模型，並且堅持「要知道誰在用、資料哪裡來、收益要回流創作者」。這件事的帳面數字是 €13.5M——對比 OpenAI 在 2025 年燒掉的 $21B，連零頭都不到。但你如果只看數字，就錯過了真正的命題：當矽谷把 AI 做成一個封閉的訂閱制產品時，歐洲正在嘗試把 AI 做成一個公共治理的實驗。 這篇文章是荷蘭應用科學研究組織 TNO 的官方立場文件，說明了 GPT-NL 的價值主張、治理架構和技術路線。值得讀的原因不是因為它技術多強——而是它所描繪的那條「不跟矽谷玩同一套遊戲」的路徑，本身就可能比任何 benchmark 更有顛覆性。

語言 AI 正在滲透工作場所、教育體系和公共服務。但對這項技術的控制權至關重要。GPT-NL 證明了另一條路是可能的：一條建立在強治理、透明和對公共價值的堅定承諾之上的路。

像 ChatGPT 這類應用中整合的語言模型，展示了 AI 在創新、生產力和社會解方上的潛力。但它們同時引發了根本性的問題。誰決定這些模型如何運作？它們使用了哪些數據？我們如何保障隱私、著作權和透明度等公共價值？

為了解決這些問題，TNO 與 SURF（荷蘭高等教育與研究 ICT 合作組織）以及荷蘭法醫研究所（NFI）合作，正在建立一個獨立的荷蘭語言模型與生態系。這個計畫強化了荷蘭與歐洲的數位自主權，也為負責任的 AI 應用提供了堅實的基礎。

GPT-NL 的核心價值

GPT-NL 圍繞四個核心價值建構：主權、開放透明、可信賴、互惠。

主權：對關鍵技術握有控制權

GPT-NL 完全在荷蘭與歐洲境內開發。這讓我們對模型、數據以及所有決策擁有完全的控制權。我們避免了對非歐洲供應商的依賴，並投資於一個與我們的法律、價值與社會目標一致的、可持續的 AI 生態系。

開放與透明：從數據來源到模型，全程可檢視

GPT-NL 建立在透明之上。我們清楚記錄數據收集和訓練過程中的每個選擇，以及我們如何處理偏見與倫理風險。原始碼以開源方式釋出，資料集的詳細資訊也全面公開。模型權重則在「受控授權」（controlled licence）下提供——這讓我們能掌握誰在使用模型，並在使用者需要了解更新或變更時主動通知。

可信賴：保護使用者與公民

GPT-NL 完全從零開始訓練。這避免了不明數據來源、著作權風險，或從既有模型繼承個人資料的可能性。我們的數據收集遵循嚴格標準：保障智慧財產權、在模型訓練前移除並匿名化個人資料、排除機密資訊、排除有害內容、避免資料集內重複。

互惠：就數據與價值達成公平協議

GPT-NL 刻意採用乾淨且合法的數據供應鏈。我們與數據提供者密切合作，並讓他們積極參與模型開發。透過「內容委員會」（Content Board），數據提供者和權利人對 GPT-NL 的未來擁有發言權。部分營收將回流給創作者。

資源效率

AI 開發需要可觀的運算能力與能源。因此我們積極關注能效與資源的負責任使用。

公共資金，公共問責

GPT-NL 由荷蘭企業局（RVO）代表經濟事務與氣候政策部出資，計畫總預算為 €1,350 萬歐元。

城武觀點

1. €13.5M 的數學：主權不是比誰錢多

OpenAI 在 2025 年虧損 $21B。Anthropic 燒錢的速度也差不多是這個量級。矽谷告訴世界的敘事是：前沿 AI 需要天文數字的資金，只有少數公司玩得起。然後荷蘭走出來，在桌上放了 €13.5M，說：「我們也要做一個自己的語言模型。」

直覺反應是笑出來。€13.5M 連 OpenAI 一天的營運成本都不夠付。但這個直覺反應正是矽谷希望你有的——它讓你用他們的計分卡來衡量所有事情。GPT-NL 的命題從一開始就不一樣：它不追求「做出全世界最強的模型」，它追求的是「做出一個荷蘭可以完全控制、完全透明、完全問責的模型」。這兩個目標的成本結構天差地別。

矽谷的商業模式把「追求 AGI」當成融資話術，錢燒得越多代表越接近目標——不管這個目標是否存在、不管這條路上有多少被報廢的模型版本。GPT-NL 的邏輯正好相反：先把治理架構和數據倫理搞定，模型能力在那個框架內長到哪裡算哪裡。 這不是「沒錢所以做比較小」，這是「目標不同所以不用你的定價表」。

€13.5M 不是一個寒酸的預算——它是一個哲學宣告：主權 AI 的入場券不需要 $21B 的虧損證明。

2. Controlled licence：透明，還是另一種監控？

GPT-NL 最值得玩味的設計不是架構或訓練方法，而是一個乍看矛盾的概念：「原始碼開源，模型權重受控授權。」翻譯成白話：你可以看到程式碼、可以研究資料集、可以理解模型怎麼運作的——但你下載權重之前，要先讓我知道你是誰。而且我之後會通知你模型更新了。

TNO 把這個叫做透明。但從另一個角度看，這比 Anthropic 或 OpenAI 的 closed API 更進一步：closed API 只是不讓你看裡面；controlled licence 是「你看了裡面，但我知道你看了，而且我會主動敲你的門」。

這裡的權力關係是全新的。傳統開源（MIT、Apache 2.0）的哲學基礎是：我把程式碼給你，從此你跟我沒有任何義務關係。GPT-NL 的 controlled licence 打破這個默契——它建立了一條雙向的、持續的通知義務。這在理念上接近歐盟的《AI Act》精神：模型提供者對下游使用有持續的責任。

但問題在這裡：誰來定義「需要通知」的門檻？ 權重更新當然要通知。但如果模型被用在你政治上不喜歡的用途上呢？如果 Content Board 認為某個應用「不符合公共價值」呢？從「通知更新」到「監管用途」之間的距離，遠比 TNO 這份文件願意承認的短。

我不是說 GPT-NL 會變成監控工具。我說的是：controlled licence 是一個需要被嚴肅辯論的治理工具，不是一個可以掛上「透明」兩個字就自動正當化的設計選擇。把「知道誰在用」叫做透明，跟把「知道誰在讀什麼書」叫做透明，修辭結構是一樣的。差別在於誰是那個「知道」的主體，以及他拿這個資訊做什麼。

3. Content Board + 收益回流：治理創新，還是歐洲官僚的全新玩法？

GPT-NL 的治理模型有三個關鍵詞：公共資金、Content Board、收益回流創作者。這聽起來好到不像真的——政府出錢、權利人監督、創作者分潤。如果你對歐洲公共計畫的執行力沒有任何歷史記憶，這的確是完美的治理三角形。

但我從新讀了三次這份文件，注意到一個刻意模糊的細節：Content Board 的組成方式、投票權重、決策程序——完全沒有說明。 文件只說「數據提供者和權利人對 GPT-NL 的未來擁有發言權」。「發言權」不是「決策權」。你可以有一百個人的 Content Board，每個人都有發言權，但最終決定權在 TNO 手上——技術上完全符合文件描述。

再來是「收益回流創作者」。這是整份文件裡最誘人也最空洞的承諾。GPT-NL 目前的商業模式是什麼？授權費？API 訂閱？這些都還沒公布。在收入結構不存在的情況下承諾「部分營收回流」，就好像在還沒有蓋房子之前承諾「部分房租會分給建材供應商」——邏輯上沒問題，實際上沒有意義。

我並不是說這個模型注定失敗。相反，它是目前歐洲公共 AI 計畫中，治理設計最完整、最誠實的一個。但「最完整」的基準線是——其他計畫根本沒有治理設計，只會喊「主權 AI」四個字。GPT-NL 至少把問題攤在桌上：數據從哪裡來、誰有發言權、錢怎麼分。它把歐洲公共 AI 的治理真空，從「沒人討論」推進到「有一份文件可以指著討論」。這本身就是有意義的進展。

真正的考驗不在這份文件裡。它在 Content Board 第一次否決 TNO 的技術決策時發生——那時候我們才會知道「發言權」到底是實權還是擺設。在那之前，GPT-NL 的治理模型是一個值得尊重的命題，不是一個可以複製的答案。

城武的未解檔案——當矽谷用 $21B 買你的注意力時，荷蘭用 €13.5M 買自己的主權。帳面上前者貴了 1,555 倍，但主權這種東西，從來不是用錢秤的。

原文：GPT‑NL: a sovereign language model for the Netherlands（TNO, 2026-06）