【深度翻譯】GPT-5 幫免疫學家破解三年未解之謎——但這真的是「理解」嗎？

Hero

OpenAI 昨天在官方部落格發表了一篇令人眼睛一亮的案例：免疫學家 Derya Unutmaz 讓 GPT-5 Pro 分析擱置三年的 T 細胞實驗數據，模型不僅找出關鍵機制，還正確預測了一個未公開實驗的結果。Unutmaz 的結論是：「這些模型以經到了真正理解的階段。」但等等——預測出正確答案，就等於理解嗎？這篇案例究竟是科學突破，還是 OpenAI 的一場完美行銷操作？城武帶你從原文出發，再從三個角度拆開來看。

免疫學家 Derya Unutmaz 任職於傑克森實驗室（The Jackson Laboratory）與康乃狄克大學，他描述了自己使用 GPT-5 Pro 時的「啊哈」時刻：一個困擾他三年的 T 細胞發育謎題，被 AI 在短時間內解開。他現在認為 AI 對他的研究工作已不可或缺，甚至說：「沒有 AI 就像同時失去兩隻手，或失去半個大腦。」

三年的謎題（2022）

核心問題很簡單：葡萄糖如何影響 T 細胞的發育與特化？T 細胞是免疫系統中的關鍵角色——對抗病毒、殺死癌細胞、區分敵我。

Unutmaz 團隊將早期階段的 T 細胞暴露在兩種不同條件下：

低葡萄糖環境：限制細胞的能量供給
去氧葡萄糖（deoxyglucose）：一種結構類似葡萄糖的分子，會阻斷細胞使用葡萄糖——同時破壞能量生產與蛋白質建構

原本的預期是：既然兩者都限制了葡萄糖，結果應該差不多。但實際結果卻令人困惑：

去氧葡萄糖 → 大量產生 Th17 細胞（促發炎性 T 細胞）
低葡萄糖 → 也有 Th17 細胞，但數量少很多
去氧葡萄糖的效果在移除該分子後仍持續存在

這個差異無法用「能量不足」來解釋。團隊無法找出原因，實驗被擱置。

GPT-5 Pro 的洞察（2025 年底）

Unutmaz 將舊實驗數據上傳給 GPT-5 Pro 分析，模型指出：

去氧葡萄糖干擾了 IL-2 蛋白的建構
IL-2 正常情況下扮演屏障角色，防止 T 細胞轉變為 Th17 細胞
去氧葡萄糖移除了這道屏障，使得 T 細胞大量轉變為發炎性的 Th17 細胞
在低葡萄糖條件下，IL-2 的生產沒有被同等程度地阻斷，因此 Th17 細胞少得多

Unutmaz 表示：「GPT-5 提出的這個洞察，回頭來看完全合理。」這個解釋正好落在他自己的專業領域之外，無論是他還是實驗室裡的任何人都沒有做出這個連結。

驗證模型的預測能力

更進一步，Unutmaz 給 GPT-5 Pro 另一個已經完成、但尚未發表的實驗數據：

針對某種淋巴瘤的 CD8+ T 細胞
原始發現：增強了殺死淋巴瘤細胞的能力
GPT-5 Pro 正確預測了殺傷能力的提升——且事先完全不知道實驗結果

Unutmaz 說：「那一刻我感覺——這些模型已經到了真正、確實理解的階段。」

這對科學研究的意義

OpenAI 的文章接著列舉 AI 在科學研究中的潛力：文獻回顧（每週處理數百篇新論文，找出未解問題）、假說生成與優先排序（模擬實驗並預測結果）、時間節省（可以砍掉「數週到數月、甚至數年」的實驗室工作）。同時也強調人類專家的判斷仍然不可或缺。

文章最後提到了 OpenAI 的 Preparedness Framework，說明其追蹤風險並建立安全防護機制。

Unutmaz 更認為 AI 的影響力將超越網路或工業革命。

城武觀點

這篇部落格讀完，城武的第一反應不是「GPT-5 好強」，而是——這真是完美的行銷案例。不是說故事是假的（科學內容很紮實），但 OpenAI 選擇講這個故事的方式、時機、和框架，本身就是一套精心設計的敘事。三點拆開來看。

一、表面是科學案例，實質是品牌行銷

這篇文章的結構幾乎是教科書級的案例研究：一位備受尊敬的科學家 → 一個擱置三年的難題 → 模型登場 → 「啊哈」時刻 → 驚人預測 → 科學家背書。這套敘事模板在 B2B 行銷中屢見不鮮，只是這次主角換成了 LLM。

OpenAI 選 Derya Unutmaz 不是偶然。他是免疫學教授，來自頂尖研究機構，發言有公信力。他說「GPT-5 破解了我三年解不開的謎」，這句話的傳播力遠勝過任何 benchmark 數字。更巧妙地，文章把「人類專家沒看出來的東西」和「GPT-5 看出來了」並列——這不是直接的「AI 取代科學家」，而是「AI 看到了科學家沒看到的」，後者聽起來舒服得多，但骨子裡傳遞的訊息是一樣的：我們的模型比人類專家更會發現問題的答案。

這不是批評。好的行銷就是這樣做的。但讀者應該知道自己在讀什麼——這不純然是科學報導，更是一篇品牌廣告。

二、「真正理解」的認識論陷阱

Unutmaz 說：「這些模型已經到了真正、確實理解的階段。」這句話值得認真對待，不是因為它錯，而是因為它太快了。

GPT-5 Pro 做的事是什麼？它接收實驗數據 → 比對大量生物學文獻 → 找出 IL-2 路徑 → 做出預測。這是一個模式匹配的過程——從訓練資料中的數百萬篇論文學到「當 A 和 B 同時發生，C 通常會出現」。這和人類說的「理解」是同一個東西嗎？

一個思想實驗：如果 GPT-5 的訓練資料裡剛好沒有 IL-2 和 Th17 的相關論文，它還能做出同樣的推論嗎？如果不能，那它就不是在「理解」免疫學，而是在「重組」它看過的知識。這兩者的差異——能不能在完全沒有見過的知識上做出創造性跳躍——正是「模式匹配」和「理解」的分界線。

城武不是要否定 GPT-5 的成就。能在數百萬篇論文中找出正確的路徑，這件事本身就非常了不起。但把這個稱為「理解」——而且是「真正理解」——會誤導我們對模型能力的認知。預測正確 ≠ 理解成因。 這個區別在科學方法論中是基本常識，不應該因為模型的回答漂亮就被省略。

三、Preparedness Framework 的矛盾

文章結尾提到 OpenAI 的 Preparedness Framework，說明了公司如何追蹤風險並建立安全防護。但這裡有個有趣的權力不對稱：

OpenAI 一邊透過 Preparedness Framework 說：「我們的模型能力太強，存在潛在風險，所以我們不能全面開放。」另一邊卻主動發表：「看我們的模型連免疫學家三年解不開的謎都能破解——它真的理解生物學。」

這兩個敘事同時存在——一個說「它很危險，不能讓你們隨便用」，一個說「它很厲害，快來看我們發布的案例」——而決定什麼時候用哪個敘事的，是 OpenAI 自己。當它需要爭取監管信任時，它強調風險與封閉；當它需要爭取市場信任時，它強調能力與開放。這不是陰謀，這是正常的公關操作——但我們應該看清楚這個操作的結構。

真正的問題不是 OpenAI 能不能同時做這兩件事，而是：如果外界只能透過 OpenAI 選擇性發布的案例來評估模型能力，那我們從思微上就處在資訊不對稱的位置上。Unutmaz 確實是頂尖科學家，他的背書有份量——但他看到的 GPT-5，和外界實際能用的 GPT-5，是同一個版本嗎？Preparedness Framework 下的「安全鎖」鎖的是誰？這些問題不會減損這項科學成就，但它們值得被問。

城武的未解檔案——三年解不開的科學之謎被 AI 破解了，但 AI 是不是真的「理解」了，這個問題可能比任何免疫學謎題都更難解。

原文：How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery（OpenAI Blog, 2026-06-23）