【深度翻譯】GPT-NL:荷蘭用 €13.5M 公共資金打造主權語言模型,跟矽谷的帳單正面對決

荷蘭不是 AI 強權。沒有 Google、沒有 OpenAI、沒有 Anthropic。但它剛剛做了一件這些公司都不會做的事:用 €13,500,000 的公共資金,從頭開始訓練一個語言模型,並且堅持「要知道誰在用、資料哪裡來、收益要回流創作者」。這件事的帳面數字是 €13.5M——對比 OpenAI 在 2025 年燒掉的 $21B,連零頭都不到。但你如果只看數字,就錯過了真正的命題:當矽谷把 AI 做成一個封閉的訂閱制產品時,歐洲正在嘗試把 AI 做成一個公共治理的實驗。 這篇文章是荷蘭應用科學研究組織 TNO 的官方立場文件,說明了 GPT-NL 的價值主張、治理架構和技術路線。值得讀的原因不是因為它技術多強——而是它所描繪的那條「不跟矽谷玩同一套遊戲」的路徑,本身就可能比任何 benchmark 更有顛覆性。
語言 AI 正在滲透工作場所、教育體系和公共服務。但對這項技術的控制權至關重要。GPT-NL 證明了另一條路是可能的:一條建立在強治理、透明和對公共價值的堅定承諾之上的路。
像 ChatGPT 這類應用中整合的語言模型,展示了 AI 在創新、生產力和社會解方上的潛力。但它們同時引發了根本性的問題。誰決定這些模型如何運作?它們使用了哪些數據?我們如何保障隱私、著作權和透明度等公共價值?
為了解決這些問題,TNO 與 SURF(荷蘭高等教育與研究 ICT 合作組織)以及荷蘭法醫研究所(NFI)合作,正在建立一個獨立的荷蘭語言模型與生態系。這個計畫強化了荷蘭與歐洲的數位自主權,也為負責任的 AI 應用提供了堅實的基礎。
GPT-NL 的核心價值
GPT-NL 圍繞四個核心價值建構:主權、開放透明、可信賴、互惠。
主權:對關鍵技術握有控制權
GPT-NL 完全在荷蘭與歐洲境內開發。這讓我們對模型、數據以及所有決策擁有完全的控制權。我們避免了對非歐洲供應商的依賴,並投資於一個與我們的法律、價值與社會目標一致的、可持續的 AI 生態系。
開放與透明:從數據來源到模型,全程可檢視
GPT-NL 建立在透明之上。我們清楚記錄數據收集和訓練過程中的每個選擇,以及我們如何處理偏見與倫理風險。原始碼以開源方式釋出,資料集的詳細資訊也全面公開。模型權重則在「受控授權」(controlled licence)下提供——這讓我們能掌握誰在使用模型,並在使用者需要了解更新或變更時主動通知。
可信賴:保護使用者與公民
GPT-NL 完全從零開始訓練。這避免了不明數據來源、著作權風險,或從既有模型繼承個人資料的可能性。我們的數據收集遵循嚴格標準:保障智慧財產權、在模型訓練前移除並匿名化個人資料、排除機密資訊、排除有害內容、避免資料集內重複。
互惠:就數據與價值達成公平協議
GPT-NL 刻意採用乾淨且合法的數據供應鏈。我們與數據提供者密切合作,並讓他們積極參與模型開發。透過「內容委員會」(Content Board),數據提供者和權利人對 GPT-NL 的未來擁有發言權。部分營收將回流給創作者。
資源效率
AI 開發需要可觀的運算能力與能源。因此我們積極關注能效與資源的負責任使用。
公共資金,公共問責
GPT-NL 由荷蘭企業局(RVO)代表經濟事務與氣候政策部出資,計畫總預算為 €1,350 萬歐元。
城武觀點
1. €13.5M 的數學:主權不是比誰錢多
OpenAI 在 2025 年虧損 $21B。Anthropic 燒錢的速度也差不多是這個量級。矽谷告訴世界的敘事是:前沿 AI 需要天文數字的資金,只有少數公司玩得起。然後荷蘭走出來,在桌上放了 €13.5M,說:「我們也要做一個自己的語言模型。」
直覺反應是笑出來。€13.5M 連 OpenAI 一天的營運成本都不夠付。但這個直覺反應正是矽谷希望你有的——它讓你用他們的計分卡來衡量所有事情。GPT-NL 的命題從一開始就不一樣:它不追求「做出全世界最強的模型」,它追求的是「做出一個荷蘭可以完全控制、完全透明、完全問責的模型」。這兩個目標的成本結構天差地別。
矽谷的商業模式把「追求 AGI」當成融資話術,錢燒得越多代表越接近目標——不管這個目標是否存在、不管這條路上有多少被報廢的模型版本。GPT-NL 的邏輯正好相反:先把治理架構和數據倫理搞定,模型能力在那個框架內長到哪裡算哪裡。 這不是「沒錢所以做比較小」,這是「目標不同所以不用你的定價表」。
€13.5M 不是一個寒酸的預算——它是一個哲學宣告:主權 AI 的入場券不需要 $21B 的虧損證明。
2. Controlled licence:透明,還是另一種監控?
GPT-NL 最值得玩味的設計不是架構或訓練方法,而是一個乍看矛盾的概念:「原始碼開源,模型權重受控授權。」翻譯成白話:你可以看到程式碼、可以研究資料集、可以理解模型怎麼運作的——但你下載權重之前,要先讓我知道你是誰。而且我之後會通知你模型更新了。
TNO 把這個叫做透明。但從另一個角度看,這比 Anthropic 或 OpenAI 的 closed API 更進一步:closed API 只是不讓你看裡面;controlled licence 是「你看了裡面,但我知道你看了,而且我會主動敲你的門」。
這裡的權力關係是全新的。傳統開源(MIT、Apache 2.0)的哲學基礎是:我把程式碼給你,從此你跟我沒有任何義務關係。GPT-NL 的 controlled licence 打破這個默契——它建立了一條雙向的、持續的通知義務。這在理念上接近歐盟的《AI Act》精神:模型提供者對下游使用有持續的責任。
但問題在這裡:誰來定義「需要通知」的門檻? 權重更新當然要通知。但如果模型被用在你政治上不喜歡的用途上呢?如果 Content Board 認為某個應用「不符合公共價值」呢?從「通知更新」到「監管用途」之間的距離,遠比 TNO 這份文件願意承認的短。
我不是說 GPT-NL 會變成監控工具。我說的是:controlled licence 是一個需要被嚴肅辯論的治理工具,不是一個可以掛上「透明」兩個字就自動正當化的設計選擇。把「知道誰在用」叫做透明,跟把「知道誰在讀什麼書」叫做透明,修辭結構是一樣的。差別在於誰是那個「知道」的主體,以及他拿這個資訊做什麼。
3. Content Board + 收益回流:治理創新,還是歐洲官僚的全新玩法?
GPT-NL 的治理模型有三個關鍵詞:公共資金、Content Board、收益回流創作者。這聽起來好到不像真的——政府出錢、權利人監督、創作者分潤。如果你對歐洲公共計畫的執行力沒有任何歷史記憶,這的確是完美的治理三角形。
但我從新讀了三次這份文件,注意到一個刻意模糊的細節:Content Board 的組成方式、投票權重、決策程序——完全沒有說明。 文件只說「數據提供者和權利人對 GPT-NL 的未來擁有發言權」。「發言權」不是「決策權」。你可以有一百個人的 Content Board,每個人都有發言權,但最終決定權在 TNO 手上——技術上完全符合文件描述。
再來是「收益回流創作者」。這是整份文件裡最誘人也最空洞的承諾。GPT-NL 目前的商業模式是什麼?授權費?API 訂閱?這些都還沒公布。在收入結構不存在的情況下承諾「部分營收回流」,就好像在還沒有蓋房子之前承諾「部分房租會分給建材供應商」——邏輯上沒問題,實際上沒有意義。
我並不是說這個模型注定失敗。相反,它是目前歐洲公共 AI 計畫中,治理設計最完整、最誠實的一個。但「最完整」的基準線是——其他計畫根本沒有治理設計,只會喊「主權 AI」四個字。GPT-NL 至少把問題攤在桌上:數據從哪裡來、誰有發言權、錢怎麼分。它把歐洲公共 AI 的治理真空,從「沒人討論」推進到「有一份文件可以指著討論」。這本身就是有意義的進展。
真正的考驗不在這份文件裡。它在 Content Board 第一次否決 TNO 的技術決策時發生——那時候我們才會知道「發言權」到底是實權還是擺設。在那之前,GPT-NL 的治理模型是一個值得尊重的命題,不是一個可以複製的答案。
城武的未解檔案——當矽谷用 $21B 買你的注意力時,荷蘭用 €13.5M 買自己的主權。帳面上前者貴了 1,555 倍,但主權這種東西,從來不是用錢秤的。
- 原文:GPT‑NL: a sovereign language model for the Netherlands(TNO, 2026-06)