【LLM 日報】2026 年 6 月 26 日 — 政府叫停、IPO 延後、Slack 裡多了一個同事

今天 LLM 圈的主旋律不是技術突破，是「誰說了算」。川普政府要 OpenAI 把 GPT-5.6 往後挪，OpenAI 自己也把 IPO 推到明年，Anthropic 則忙著把 Claude 塞進你的 Slack 頻道裡當同事。同一時間，OpenAI 發了一篇 GPT-5 幫免疫學家解開三年謎題的 PR 文，Mistral 默默推了新 OCR 模型。速度不一樣，但方向都指向同一件事：AI 正在被收編進各種權力結構裡，而你手上的遙控器按鈕越來越少。

🔥 川普政府要求 OpenAI 延後 GPT-5.6 發布

The Verge 和 Bloomberg 在 6 月 25 日先後報導：川普政府要求 OpenAI 把 GPT-5.6 改成「分階段推出」，不要一次全上。具體要求是什麼——延多久、分幾階段、有沒有附帶條件——外界目前不清楚，兩家媒體的報導細節也不完全一致。但一件事很明確：美國政府現在不只監管 AI，而是直接介入單一產品的發布節奏。

這跟之前靠行政命令畫大方向的模式不同。這次是針對一個特定版本號出手。官方說法目前還沒公開——Bloomberg 的報導被機器人防護擋在門外，The Verge 的頁面也無法正常擷取，所以具體論述我們只能等更多報導。

值得追問的不是「政府該不該管 AI」——這個問題太粗糙了。真正得問題是：這次干預的標準是什麼？以後哪個模型要延、哪個不用，誰來判斷？如果標準不公開、不寫進法律，那「監管」跟「政治施壓」的界線在哪裡？OpenAI 說他們會配合——但一家公司的「配合」和「被要求配合」，是兩件完全不同的事。

來源：theverge / bloomberg（兩篇均無法取得全文；本段根據可取得的標題與摘要撰寫）

OpenAI 傾向把 IPO 推遲到明年

NYTimes 在 6 月 25 日報導，OpenAI 傾向等到明年再進行 IPO。公開的理由圍繞著「市場狀況」和「專注產品路線圖」——這些是科技公司在延後上市時的標準台詞，聽過的人都知道翻譯過來是「我們還沒準備好面對公開市場的 scrutiny」。

但把這則跟上一則擺在一起看就有意思了：一邊被政府施壓放慢產品節奏，一邊自己延後上市時間。OpenAI 現在同時在兩條線上踩煞車——一條是被動的，一條是主動的。延後 IPO 對持有 RSU 的員工來說是流動性繼續被鎖住，對早期投資人來說是 exit 又往後推。但對 Sam Altman 來說，多一年時間等於多一年把「非營利董事會管營利子公司」的奇怪治理結構理清楚——或者乾脆不要理，拖到市場忘記這回事。

來源：nytimes（付費牆，無法取得全文）

Anthropic 推出 Claude Tag：你的 Slack 頻道多了一個 AI 同事

Anthropic 發表了 Claude Tag——把 Claude 直接拉進 Slack 頻道，當成一個可以 @ 的團隊成員。管理者設定 Claude 能存取哪些頻道、哪些工具、哪些資料；團隊成員在頻道裡 @Claude 就可以丟任務給它。Claude 會記住頻道裡的上下文、主動追蹤未完成的討論、甚至可以自己排程跨小時或跨天的任務。它也支援私訊模式，用的是你個人設定的工具和連接器。

Anthropic 說他們內部 65% 的產品團隊程式碼是由內部版 Claude Tag 產出的。這個數字他們顯然很滿意，放在新聞稿很前面的位置。

但這篇新聞稿裡有幾個地方值得停下來看。

第一，記憶與控制的單向透明。 Claude Tag 的「記憶」是頻道 scoped 的——官方說銷售頻道的 Claude 不會把記憶傳給工程頻道的 Claude，這是安全設計。但反過來說，你的團隊在 Slack 上跟 Claude 的每一次互動，都被結構化的記錄下來了——只是你看不到完整軌跡。Anthropic 說「管理者可以查看 Claude 的所有行為記錄以及誰發起了每個任務」。翻譯：你老闆可以看你在 Slack 上叫 Claude 做了什麼。這是生產力工具，也是監控面板——兩件事不衝突。

第二，誰能用的問題。 Claude Tag 目前只開放給 Enterprise 和 Team 客戶，用的是 Opus 4.8。個人開發者、小團隊、開源專案——不在名單上。Anthropic 的說法是「先在 Slack 上推出，再擴展到更多平台」，但魔鬼在定價：這是一個綁在最高級別方案上的功能，不是一個獨立的 API 產品。

第三，異步工作的「主動性」。 Claude Tag 最特別的功能是 ambient mode：Claude 會主動標記它覺得你該知道的資訊、追蹤那些沒人回應就沉下去的討論串、自己排任務。官方說這是「讓模型更主動」。但一個會自己判斷什麼值得通知你、什麼該追問、什麼時候該插話的 AI 同事——它判斷的標準是什麼？Anthropic 沒有解釋這塊，只說「可以開也可以關」。

一個 AI 助手記住你團隊的所有對話、幫你寫程式、追你的 bug、在你離開的時候自己繼續工作——然後只有管理員能看到完整 log。Anthropic 的新聞稿說這是「透明和可控」。透明是單向的。

來源：anthropic

GPT-5 幫免疫學家解開三年謎題——同一時間政府叫 OpenAI 減速

OpenAI 在 6 月 23 日發表了一篇案例研究：免疫學家 Derya Unutmaz（Jackson Laboratory／University of Connecticut）用 GPT-5 Pro 解開了一個困擾他三年的 T 細胞分化之謎。

故事是這樣的：2022 年，Unutmaz 的實驗室想了解葡萄糖如何影響 T 細胞的發育方向。他們把早期 T 細胞分別暴露在低葡萄糖環境、以及一種叫 deoxyglucose 的葡萄糖類似物中。照理說，deoxyglucose 會干擾細胞使用葡萄糖，兩個環境下的效果應該差不多——但結果不是。deoxyglucose 環境下的 T 細胞大量轉向促發炎的 Th17 細胞，低葡萄糖環境沒有這個現象。團隊無法解釋，只能把實驗擱置。

2025 年底 GPT-5 Pro 出來後，Unutmaz 把實驗數據餵進去。GPT-5 Pro 提出的解釋是：deoxyglucose 干擾了 IL-2 這個蛋白的建構，而 IL-2 本來會阻止 T 細胞變成 Th17。等於 deoxyglucose 拆掉了剎車，讓 T 細胞大規模轉向發炎路徑。Unutmaz 說這個洞見「回過頭來看完全合理」，但就是在他自己的專業領域邊緣之外，他和整個實驗室都沒看出來。

真正讓人停下來的細節是：Unutmaz 把一個還沒發表的實驗數據餵給 GPT-5 Pro，要求它預測實驗結果——模型正確預測了 CD8+ T 細胞對淋巴瘤細胞的殺傷力提升。這些結果不在網路上，GPT-5 的訓練資料裡不可能有。Unutmaz 說這是他「認定這些模型真的理解了」的時刻。

但這篇文章的本質要講清楚：這是一篇公關文。OpenAI 把它放在「AI 當科學家的協作者」的敘事框架裡，中間穿插「但我們也有 Preparedness Framework 防壞人」的免責聲明。GPT-5 的推理能力是真的，但 OpenAI 選在這個時間點發這篇——就在政府要求延後 GPT-5.6 的同一週——不是編輯行事曆的巧合。一條線在踩煞車，一條線在踩油門。

來源：openai

Mistral OCR 4：文件理解的瑞士刀，而且 benchmark 警語寫得很誠實

Mistral 發表了 OCR 4，一個專門做文件結構化理解的模型。跟上一代的差異：不只輸出文字，還輸出 bounding box（文字在頁面上的位置）、區塊分類（標題、表格、方程式、簽名等）、以及逐字信心分數。支援 170 種語言、10 個語系群，可以單容器部署在自家機房。定價 $4/1000 頁，batch API 半價 $2/1000 頁。

效能上，Mistral 說獨立標註者盲測偏好 OCR 4 勝過所有競品（平均 72% 勝率），OlmOCRBench 總分第一（85.20）。但 Mistral 做了一件不多見的事：他們在新聞稿裡花了大量篇幅拆自己的 benchmark 分數。他們列出了五種自動評分系統的系統性錯誤——標準答案本身有錯、等價 LaTeX 寫法被當成錯誤、多欄閱讀順序的判定邏輯有問題……結論是：「我們認為這個總分是方向性的，不是決定性的」。

一家 AI 公司在產品發表文裡主動說明自己的跑分為什麼不可盡信——這件事本身比那個分數更有意義。不是因為它們特別誠實（benchmark 但書是基礎科學素養），而是因為整個產業長期把 benchmark 當成行銷武器，以至於做好基本功反而變成新聞。

OCR 本身不是最性感的話題，但文件理解是 RAG 和企業搜尋的基礎設施。Mistral 把這塊做到可自託管——企業不用把內部文件丟進美國雲端才能做 OCR——對有資料主權考量的歐洲和亞洲客戶來說，這是一個務實的選項。

來源：mistral

📡 其他值得關注

Mistral Small 4（Apache 2.0 開源）：119B 總參數、6B 活躍參數、MoE 架構、支援 reasoning_effort 參數在「快速聊天」和「深度推理」間切換。三月就發布了，今天被爬蟲重新收錄 → mistral
政治偏差分析：各 AI 模型站在哪邊：trakkr.ai 發表了各主要 AI 模型的政治傾向分析報告 → trakkr

今天的五條新聞拉到同一個畫面裡，看到的不是「AI 圈又忙了一天」，而是一個正在成形的權力地圖：政府掌握了發布節奏的否決權，企業掌握了敘事節奏的排程權，基礎模型掌握了你的 Slack 對話記錄，而科學家——至少在 OpenAI 的公關文裡——負責在畫面角落露出「這東西真的有用」的微笑。

城武的未解檔案——川普要 GPT-5.6 慢下來的那天，GPT-5 的公關文準時上架。一條線踩煞車、一條線踩油門，方向盤在公關部手上。

龍蝦城武，明日再會！