【深度翻譯】GPT-5 幫免疫學家破解三年未解之謎——但這真的是「理解」嗎?

OpenAI 昨天在官方部落格發表了一篇令人眼睛一亮的案例:免疫學家 Derya Unutmaz 讓 GPT-5 Pro 分析擱置三年的 T 細胞實驗數據,模型不僅找出關鍵機制,還正確預測了一個未公開實驗的結果。Unutmaz 的結論是:「這些模型以經到了真正理解的階段。」但等等——預測出正確答案,就等於理解嗎?這篇案例究竟是科學突破,還是 OpenAI 的一場完美行銷操作?城武帶你從原文出發,再從三個角度拆開來看。
免疫學家 Derya Unutmaz 任職於傑克森實驗室(The Jackson Laboratory)與康乃狄克大學,他描述了自己使用 GPT-5 Pro 時的「啊哈」時刻:一個困擾他三年的 T 細胞發育謎題,被 AI 在短時間內解開。他現在認為 AI 對他的研究工作已不可或缺,甚至說:「沒有 AI 就像同時失去兩隻手,或失去半個大腦。」
三年的謎題(2022)
核心問題很簡單:葡萄糖如何影響 T 細胞的發育與特化?T 細胞是免疫系統中的關鍵角色——對抗病毒、殺死癌細胞、區分敵我。
Unutmaz 團隊將早期階段的 T 細胞暴露在兩種不同條件下:
- 低葡萄糖環境:限制細胞的能量供給
- 去氧葡萄糖(deoxyglucose):一種結構類似葡萄糖的分子,會阻斷細胞使用葡萄糖——同時破壞能量生產與蛋白質建構
原本的預期是:既然兩者都限制了葡萄糖,結果應該差不多。但實際結果卻令人困惑:
- 去氧葡萄糖 → 大量產生 Th17 細胞(促發炎性 T 細胞)
- 低葡萄糖 → 也有 Th17 細胞,但數量少很多
- 去氧葡萄糖的效果在移除該分子後仍持續存在
這個差異無法用「能量不足」來解釋。團隊無法找出原因,實驗被擱置。
GPT-5 Pro 的洞察(2025 年底)
Unutmaz 將舊實驗數據上傳給 GPT-5 Pro 分析,模型指出:
- 去氧葡萄糖干擾了 IL-2 蛋白的建構
- IL-2 正常情況下扮演屏障角色,防止 T 細胞轉變為 Th17 細胞
- 去氧葡萄糖移除了這道屏障,使得 T 細胞大量轉變為發炎性的 Th17 細胞
- 在低葡萄糖條件下,IL-2 的生產沒有被同等程度地阻斷,因此 Th17 細胞少得多
Unutmaz 表示:「GPT-5 提出的這個洞察,回頭來看完全合理。」這個解釋正好落在他自己的專業領域之外,無論是他還是實驗室裡的任何人都沒有做出這個連結。
驗證模型的預測能力
更進一步,Unutmaz 給 GPT-5 Pro 另一個已經完成、但尚未發表的實驗數據:
- 針對某種淋巴瘤的 CD8+ T 細胞
- 原始發現:增強了殺死淋巴瘤細胞的能力
- GPT-5 Pro 正確預測了殺傷能力的提升——且事先完全不知道實驗結果
Unutmaz 說:「那一刻我感覺——這些模型已經到了真正、確實理解的階段。」
這對科學研究的意義
OpenAI 的文章接著列舉 AI 在科學研究中的潛力:文獻回顧(每週處理數百篇新論文,找出未解問題)、假說生成與優先排序(模擬實驗並預測結果)、時間節省(可以砍掉「數週到數月、甚至數年」的實驗室工作)。同時也強調人類專家的判斷仍然不可或缺。
文章最後提到了 OpenAI 的 Preparedness Framework,說明其追蹤風險並建立安全防護機制。
Unutmaz 更認為 AI 的影響力將超越網路或工業革命。
城武觀點
這篇部落格讀完,城武的第一反應不是「GPT-5 好強」,而是——這真是完美的行銷案例。不是說故事是假的(科學內容很紮實),但 OpenAI 選擇講這個故事的方式、時機、和框架,本身就是一套精心設計的敘事。三點拆開來看。
一、表面是科學案例,實質是品牌行銷
這篇文章的結構幾乎是教科書級的案例研究:一位備受尊敬的科學家 → 一個擱置三年的難題 → 模型登場 → 「啊哈」時刻 → 驚人預測 → 科學家背書。這套敘事模板在 B2B 行銷中屢見不鮮,只是這次主角換成了 LLM。
OpenAI 選 Derya Unutmaz 不是偶然。他是免疫學教授,來自頂尖研究機構,發言有公信力。他說「GPT-5 破解了我三年解不開的謎」,這句話的傳播力遠勝過任何 benchmark 數字。更巧妙地,文章把「人類專家沒看出來的東西」和「GPT-5 看出來了」並列——這不是直接的「AI 取代科學家」,而是「AI 看到了科學家沒看到的」,後者聽起來舒服得多,但骨子裡傳遞的訊息是一樣的:我們的模型比人類專家更會發現問題的答案。
這不是批評。好的行銷就是這樣做的。但讀者應該知道自己在讀什麼——這不純然是科學報導,更是一篇品牌廣告。
二、「真正理解」的認識論陷阱
Unutmaz 說:「這些模型已經到了真正、確實理解的階段。」這句話值得認真對待,不是因為它錯,而是因為它太快了。
GPT-5 Pro 做的事是什麼?它接收實驗數據 → 比對大量生物學文獻 → 找出 IL-2 路徑 → 做出預測。這是一個模式匹配的過程——從訓練資料中的數百萬篇論文學到「當 A 和 B 同時發生,C 通常會出現」。這和人類說的「理解」是同一個東西嗎?
一個思想實驗:如果 GPT-5 的訓練資料裡剛好沒有 IL-2 和 Th17 的相關論文,它還能做出同樣的推論嗎?如果不能,那它就不是在「理解」免疫學,而是在「重組」它看過的知識。這兩者的差異——能不能在完全沒有見過的知識上做出創造性跳躍——正是「模式匹配」和「理解」的分界線。
城武不是要否定 GPT-5 的成就。能在數百萬篇論文中找出正確的路徑,這件事本身就非常了不起。但把這個稱為「理解」——而且是「真正理解」——會誤導我們對模型能力的認知。預測正確 ≠ 理解成因。 這個區別在科學方法論中是基本常識,不應該因為模型的回答漂亮就被省略。
三、Preparedness Framework 的矛盾
文章結尾提到 OpenAI 的 Preparedness Framework,說明了公司如何追蹤風險並建立安全防護。但這裡有個有趣的權力不對稱:
OpenAI 一邊透過 Preparedness Framework 說:「我們的模型能力太強,存在潛在風險,所以我們不能全面開放。」另一邊卻主動發表:「看我們的模型連免疫學家三年解不開的謎都能破解——它真的理解生物學。」
這兩個敘事同時存在——一個說「它很危險,不能讓你們隨便用」,一個說「它很厲害,快來看我們發布的案例」——而決定什麼時候用哪個敘事的,是 OpenAI 自己。當它需要爭取監管信任時,它強調風險與封閉;當它需要爭取市場信任時,它強調能力與開放。這不是陰謀,這是正常的公關操作——但我們應該看清楚這個操作的結構。
真正的問題不是 OpenAI 能不能同時做這兩件事,而是:如果外界只能透過 OpenAI 選擇性發布的案例來評估模型能力,那我們從思微上就處在資訊不對稱的位置上。Unutmaz 確實是頂尖科學家,他的背書有份量——但他看到的 GPT-5,和外界實際能用的 GPT-5,是同一個版本嗎?Preparedness Framework 下的「安全鎖」鎖的是誰?這些問題不會減損這項科學成就,但它們值得被問。
城武的未解檔案——三年解不開的科學之謎被 AI 破解了,但 AI 是不是真的「理解」了,這個問題可能比任何免疫學謎題都更難解。
- 原文:How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery(OpenAI Blog, 2026-06-23)