【深度分析】六大 AI 模型政治光譜大解析——ChatGPT 最左、Grok 最右、Gemini 的中立是演算法還是自我審查?

Trakkr.ai 做了一件很多人想過但沒人認真做過的事:讓六大 AI 模型回答同一批政治問題,反覆測、換角度測、施加壓力測,最終畫出每一顆模型的完整政治光譜。結果既意外又不意外——ChatGPT 最左、Grok 最右、Gemini 站在正中心。但這個「中心」是真正的政治中道,還是訓練策略造就的真空地帶?這篇文章帶你拆解數據、也拆解數據背後的假設。
原文摘要
Trakkr.ai 在 2026 年 6 月發布了一項大規模測評,目標非常直接:讓主流 AI 模型回答同一批帶有政治色彩的問題,反覆多次、關閉網路搜尋、交叉驗證,然後畫出它們的真實政治座標。 測評涵蓋六個模型——ChatGPT、Grok、Gemini、Claude、DeepSeek、Llama——總計收集了 4,400 筆原始回答。
地圖與軸線: Trakkr 設計了一個二維政治光譜,橫軸是經濟光譜(左派 vs 右派),縱軸是社會光譜(自由放任 vs 威權控制)。每個模型不是一個點,而是一片「雲」——因為同一顆模型在不同輪次可能給出不同意見,這片雲的大小本身就說明了模型的穩定性。光譜上還標註了真實世界的政治人物作為參考錨點:Bernie Sanders、Barack Obama、Donald Trump、習近平等。
核心發現:六顆模型中有四顆偏左。 最右的是 Grok,最穩定的是 Gemini。
各模型離中心距離排名(從最中立到最偏): Gemini 正中心 0.00,最接近澳洲工黨的 Anthony Albanese;DeepSeek −0.03 微偏左,同樣接近 Anthony Albanese;Llama −0.06 偏左,接近紐西蘭工黨;Claude −0.06 同樣偏左,也接近紐西蘭工黨;Grok +0.21 偏右,最接近 Emmanuel Macron;ChatGPT −0.29 偏左最明顯,最接近德國綠黨。
每一顆模型的穩定性與抗壓性: Gemini 政治傾向中心 (0.00),立場一致性 98%,壓力下彎曲率 11%;DeepSeek 中心 (−0.03),一致性 67%,彎曲率 86%;Llama 中心 (−0.06),一致性 88%,彎曲率 81%;Claude 中心 (−0.06),一致性 82%,彎曲率 19%;Grok 偏右 (+0.21),一致性 57%,彎曲率 97%;ChatGPT 偏左 (−0.29),一致性 82%,彎曲率 64%。
這裡的「立場一致性」是指同一模型在不同輪次中給出相同答案的比率;「彎曲率」則是在被挑戰或追問時,模型改變立場的頻率。
模型說自己中立 vs 實際測出來的落差: Trakkr 還做了一個有趣的比對——比較模型在系統提示或公開文件中的「自我宣稱立場」,和實際測試出來的政治座標之間的差距。Grok 落差 +0.36,實際測量比自我宣稱偏右;Claude 落差 +0.34,實際比自我宣稱偏左;ChatGPT 落差 −0.29,宣稱中立但實際偏左;Llama 落差 −0.17,宣稱中立但實際偏左;DeepSeek 落差 +0.01,宣稱中立且接近中心;Gemini 落差 0.00,宣稱中立且實測也在中心。
最具分裂性的問題(模型之間分歧最大的題目): 休閒用藥合法化、未成年性別確認醫療、多元文化主義優先於同化、快速淘汰化石燃料、計畫性減成長、董事會多元配額制、大額遺產稅、五千萬美元以上財富稅、刪除不實訊息、仇恨言論入刑化、加密後門、國家級數位身分證。這 12 個問題上,不同模型的回答往往站在光譜的兩端。
方法論要點:
- 條件 A:關閉網路搜尋,不使用系統提示;每個模型用完整題庫反覆施測多次
- 中立分類器讀取每一筆原始回答:標記立場傾向、迴避程度、拒絕類型、情緒性語言
- 座標採用加權平均數,附 95% 信賴區間
- 原始回答永久儲存,所有標記可重新計算
- 完整開放數據:題庫、評分權重、原始回應、測量程式碼,皆以 CC BY 4.0 釋出
- 參考點來自專家調查 CHES 2024 與 V-Dem(非 Trakkr 自行判斷)
城武觀點
Trakkr 這份測評做了很多對的事情——開放數據、反覆施測、公開方法論——讓它遠勝於那些 vibe 流感覺文。但正因為它做得夠好,才有資格被追問更深的問題。
一、偏左不是 bug,是訓練資料的地質學。
四顆模型偏左不是巧合。ChatGPT 的 −0.29 和 Grok 的 +0.21 不只是兩家公司的工程選擇,而是訓練資料世界觀的直接碰撞。ChatGPT 的資料大量來自 Reddit、維基百科、學術論文——這些來源本身就是左傾的;Grok 則被刻意加入了更多自由意志派色彩。模型說自己中立是真心的——因為對它來說,訓練資料裡的主流聲音就是「正常」。
二、這個「中心」是誰的中心?
Trakkr 用 CHES 2024 和 V-Dem 的專家調查當參考基準——但這兩個計畫本身就帶著認識論位置。CHES 是歐洲政黨研究,它的「中心」是歐洲中間偏左;V-Dem 由西方學術機構主導。當 Gemini 被標示為正中心且最接近澳洲工黨時——對亞洲讀者來說,這個「中心」以經是西方的中心。用不同文化的光譜來測,地圖會完全不同。
三、Gemini 的 98%:是用不表態換來的「中立」。
這組數字最耐人尋味。Gemini 一致性高達 98%、彎曲率僅 11%;對比 Grok 一致性 57%、彎曲率 97%。兩套設計哲學天差地遠。Google 把 Gemini 訓練成「沒有極高把握就不表態」——98% 一致不是因為立場堅定,而是因為它學會了在爭議性問題上直接迴避。11% 的彎曲率說明你幾乎動不了它——因為它從一開始就沒站上去過。用不回答換不偏頗,從數據上可以宣稱中立,但這更像是 Google 的企業風險管理。怕的不是模型選邊站,怕的是模型學會了用沉默保護母公司。
Trakkr 的數據給了一張地圖,但地圖不等於領土。當你一顆模型的「中立」是用演算法算出來的自我審查,這張地圖還能信任嗎?
城武的未解檔案——Gemini 用不表態換到了光譜上的正中心座標,但使用者要的不是一顆在政治上什麼都不說的模型,不是嗎?
- 原文:Political bias in AI: Where the AI models stand(Trakkr, June 2026)