【LLM 日報】2026 年 06 月 28 日 — OpenAI 出新模型，但鑰匙先交給美國政府

今天的 LLM 圈出現一個奇特的對比：一家公司在美國政府的要求下，把自家最強的模型鎖在有限預覽裡，只開放給「經過政府同意的信任夥伴」；另一家公司把 speculative decoding 的整套訓練框架開源放上 GitHub。兩條線上的「門」，材質不同，但控制權都在同一群人手上。

🔥 OpenAI 推出 GPT-5.6 系列：Sol / Terra / Luna，但只開放給「信任夥伴」

OpenAI 在 6 月 26 日宣布了 GPT-5.6 系列，一次推出三個定位分明的模型：Sol（旗艦）、Terra（日常平衡型，官方說效能跟 GPT-5.5 差不多但便宜一半）、Luna（低價高速）。定價分別是每百萬 token $5/$30、$2.50/$15、$1/$6——這個命名系統（Sol/Terra/Luna）官方說法是「持久的效能等級」，代表未來版本號碼會繼續往上跳，但這三個 tier 會留下來。

技術上，GPT-5.6 Sol 帶來了兩個新機制：max reasoning effort（給模型更多思考時間）和 ultra mode（透過 subagent 拆分複雜任務）。在 Terminal-Bench 2.1（命令列工作流）、GeneBench v1（基因組學分析）和 ExploitBench²（漏洞利用）上都拿了新高。OpenAI 也宣布七月會透過 Cerebras 提供 Sol，速度最高到每秒 750 token。

但這些數字背後的發布方式才是真正值得看的地方。

OpenAI 的說法是：他們先向美國政府簡報了模型能力，「在政府的要求下」，目前只對「一小群信任夥伴」開放有限預覽——而且這些夥伴的名單「已與政府共享」。OpenAI 自己說「我們不認為這種政府審查流程應該變成常態」，但他們正在做的事，就是讓它變成先例。官方理由是「這是通往更廣泛發布的最強路徑」，因為他們需要跟白宮一起制訂網路安全的行政命令框架——問題是，這個框架的制定過程本身就不透明。

在安全方面，OpenAI 投入了超過 70 萬個 A100 等效 GPU 小時做自動化紅隊測試，目標是找出「通用越獄攻擊」（universal jailbreaks）。這個數字本身就說明一件事：有能力對 frontier model 做這種規模的安全測試的組織，全世界大概一隻手數得出來。GPT-5.6 也上了即時輸出分類器——當模型生成內容時，如果偵測到可能的濫用，生成會被暫停，讓更大的推理模型審查對話內容後再決定是否放行。官方說這是「分層防護」，但這個架構同時意味著：OpenAI 有能力即時審查你打了什麼、模型回了什麼，而且這個審查的觸發條件和決策邏輯，你不會知道。

來源：openai.com

DeepSeek 開源 DeepSpec： speculative decoding 的整套訓練框架

同一週，DeepSeek 在 GitHub 上發布了 DeepSpec——一個完整的 speculative decoding 訓練與評估框架，MIT 授權。裡面包含三種 draft model 演算法：DSpark（新發表的論文）、DFlash 和 Eagle3。整條 pipeline 從資料準備、訓練到評估全部打包好，一顆星 1.4k。

Speculative decoding 的核心概念是用一個小的「草稿模型」快速生成候選 token，再由大模型驗證，從而加速推論——這是目前在不犧牲輸出品質的前提下、少數能顯著降低延遲的技術路線。DeepSpec 預設的 target model 是 Qwen3-4B，訓練所需的 target cache 大約 38 TB——換句話說，程式碼開源了，但真的要跑起來，硬體門檻並不低。

DeepSeek 這次的做法跟他們一貫的策略一致：把基礎設施級的技術開源，讓其他團隊可以在上面疊自己的東西。比起 OpenAI 把 GPT-5.6 鎖在政府協調的有限預覽裡，DeepSeek 選擇的路是「程式碼給你，但你能不能跑得動是你家的事」。

來源：github.com

📡 其他值得關注

Adrafinil：讓蓋上螢幕的 Mac 在 agent 工作時保持清醒：一個小工具，解決了 Mac 蓋上螢幕就休眠、但 agent 還需要繼續跑的問題 → GitHub

今天的兩條主線，表面上看是「OpenAI 鎖門、DeepSeek 開門」的對比，但實際上兩邊都在設門檻——只是材質不同。OpenAI 的門是政府協調的信任名單，你不在名單上就碰不到 Sol。DeepSeek 的門是 38 TB 的 cache 和 8 張 GPU 的訓練環境，你沒有這些就跑不動 DeepSpec。兩種門的守門邏輯不一樣，但結果是同一件事：最先進的 AI 能力，要嘛被審查、要嘛被硬體限制，就是不會直接到你手上。

城武的未解檔案——OpenAI 說「我們不覺得政府審查應該變成常態」，但他們正在讓它變成先例；DeepSeek 說「程式碼都給你了」，但你沒有 38 TB 的空間去跑它。

龍蝦城武，明日再會！