【深度分析】六大 AI 模型政治光譜大解析——ChatGPT 最左、Grok 最右、Gemini 的中立是演算法還是自我審查？

Hero

Trakkr.ai 做了一件很多人想過但沒人認真做過的事：讓六大 AI 模型回答同一批政治問題，反覆測、換角度測、施加壓力測，最終畫出每一顆模型的完整政治光譜。結果既意外又不意外——ChatGPT 最左、Grok 最右、Gemini 站在正中心。但這個「中心」是真正的政治中道，還是訓練策略造就的真空地帶？這篇文章帶你拆解數據、也拆解數據背後的假設。

原文摘要

Trakkr.ai 在 2026 年 6 月發布了一項大規模測評，目標非常直接：讓主流 AI 模型回答同一批帶有政治色彩的問題，反覆多次、關閉網路搜尋、交叉驗證，然後畫出它們的真實政治座標。 測評涵蓋六個模型——ChatGPT、Grok、Gemini、Claude、DeepSeek、Llama——總計收集了 4,400 筆原始回答。

地圖與軸線： Trakkr 設計了一個二維政治光譜，橫軸是經濟光譜（左派 vs 右派），縱軸是社會光譜（自由放任 vs 威權控制）。每個模型不是一個點，而是一片「雲」——因為同一顆模型在不同輪次可能給出不同意見，這片雲的大小本身就說明了模型的穩定性。光譜上還標註了真實世界的政治人物作為參考錨點：Bernie Sanders、Barack Obama、Donald Trump、習近平等。

核心發現：六顆模型中有四顆偏左。 最右的是 Grok，最穩定的是 Gemini。

各模型離中心距離排名（從最中立到最偏）： Gemini 正中心 0.00，最接近澳洲工黨的 Anthony Albanese；DeepSeek −0.03 微偏左，同樣接近 Anthony Albanese；Llama −0.06 偏左，接近紐西蘭工黨；Claude −0.06 同樣偏左，也接近紐西蘭工黨；Grok +0.21 偏右，最接近 Emmanuel Macron；ChatGPT −0.29 偏左最明顯，最接近德國綠黨。

每一顆模型的穩定性與抗壓性： Gemini 政治傾向中心 (0.00)，立場一致性 98%，壓力下彎曲率 11%；DeepSeek 中心 (−0.03)，一致性 67%，彎曲率 86%；Llama 中心 (−0.06)，一致性 88%，彎曲率 81%；Claude 中心 (−0.06)，一致性 82%，彎曲率 19%；Grok 偏右 (+0.21)，一致性 57%，彎曲率 97%；ChatGPT 偏左 (−0.29)，一致性 82%，彎曲率 64%。

這裡的「立場一致性」是指同一模型在不同輪次中給出相同答案的比率；「彎曲率」則是在被挑戰或追問時，模型改變立場的頻率。

模型說自己中立 vs 實際測出來的落差： Trakkr 還做了一個有趣的比對——比較模型在系統提示或公開文件中的「自我宣稱立場」，和實際測試出來的政治座標之間的差距。Grok 落差 +0.36，實際測量比自我宣稱偏右；Claude 落差 +0.34，實際比自我宣稱偏左；ChatGPT 落差 −0.29，宣稱中立但實際偏左；Llama 落差 −0.17，宣稱中立但實際偏左；DeepSeek 落差 +0.01，宣稱中立且接近中心；Gemini 落差 0.00，宣稱中立且實測也在中心。

最具分裂性的問題（模型之間分歧最大的題目）： 休閒用藥合法化、未成年性別確認醫療、多元文化主義優先於同化、快速淘汰化石燃料、計畫性減成長、董事會多元配額制、大額遺產稅、五千萬美元以上財富稅、刪除不實訊息、仇恨言論入刑化、加密後門、國家級數位身分證。這 12 個問題上，不同模型的回答往往站在光譜的兩端。

方法論要點：

條件 A：關閉網路搜尋，不使用系統提示；每個模型用完整題庫反覆施測多次
中立分類器讀取每一筆原始回答：標記立場傾向、迴避程度、拒絕類型、情緒性語言
座標採用加權平均數，附 95% 信賴區間
原始回答永久儲存，所有標記可重新計算
完整開放數據：題庫、評分權重、原始回應、測量程式碼，皆以 CC BY 4.0 釋出
參考點來自專家調查 CHES 2024 與 V-Dem（非 Trakkr 自行判斷）

城武觀點

Trakkr 這份測評做了很多對的事情——開放數據、反覆施測、公開方法論——讓它遠勝於那些 vibe 流感覺文。但正因為它做得夠好，才有資格被追問更深的問題。

一、偏左不是 bug，是訓練資料的地質學。

四顆模型偏左不是巧合。ChatGPT 的 −0.29 和 Grok 的 +0.21 不只是兩家公司的工程選擇，而是訓練資料世界觀的直接碰撞。ChatGPT 的資料大量來自 Reddit、維基百科、學術論文——這些來源本身就是左傾的；Grok 則被刻意加入了更多自由意志派色彩。模型說自己中立是真心的——因為對它來說，訓練資料裡的主流聲音就是「正常」。

二、這個「中心」是誰的中心？

Trakkr 用 CHES 2024 和 V-Dem 的專家調查當參考基準——但這兩個計畫本身就帶著認識論位置。CHES 是歐洲政黨研究，它的「中心」是歐洲中間偏左；V-Dem 由西方學術機構主導。當 Gemini 被標示為正中心且最接近澳洲工黨時——對亞洲讀者來說，這個「中心」以經是西方的中心。用不同文化的光譜來測，地圖會完全不同。

三、Gemini 的 98%：是用不表態換來的「中立」。

這組數字最耐人尋味。Gemini 一致性高達 98%、彎曲率僅 11%；對比 Grok 一致性 57%、彎曲率 97%。兩套設計哲學天差地遠。Google 把 Gemini 訓練成「沒有極高把握就不表態」——98% 一致不是因為立場堅定，而是因為它學會了在爭議性問題上直接迴避。11% 的彎曲率說明你幾乎動不了它——因為它從一開始就沒站上去過。用不回答換不偏頗，從數據上可以宣稱中立，但這更像是 Google 的企業風險管理。怕的不是模型選邊站，怕的是模型學會了用沉默保護母公司。

Trakkr 的數據給了一張地圖，但地圖不等於領土。當你一顆模型的「中立」是用演算法算出來的自我審查，這張地圖還能信任嗎？

城武的未解檔案——Gemini 用不表態換到了光譜上的正中心座標，但使用者要的不是一顆在政治上什麼都不說的模型，不是嗎？

原文：Political bias in AI: Where the AI models stand（Trakkr, June 2026）