【LLM 日報】2026 年 06 月 15 日 —「安全敘事的迴力鏢」：Anthropic 求政府監管，政府監管了 Anthropic

今天的 LLM 圈只有一條真正重要的故事，但這故事有好幾層。最外面那層你已經知道了：美國政府禁止外國人存取 Claude Fable 5 和 Mythos 5。裡面那層是獨立評論者開始追問一個尖銳的問題——這一切，是不是 Anthropic 自己求來的？同一時間，實際用過 Fable 5 的人給了第一手評價，而 Interconnects 的 Nathan Lambert 拆解了 Fable 5 安全措施的真正意圖。三條線索指向同一件事：安全敘事是一把迴力鏢，你丟出去的時候覺得只會打到別人，但它第一個打到的往往是你自己。

🔥「是 Anthropic 自己求來的嗎？」——一篇殺傷力極強的評論

獨立作者 SE Gyges 在 Substack 通訊《Very Sane AI》上發表了一篇標題就是論點的文章：Did Anthropic Ask For This?。文章的核心論證極其簡單：

Dario Amodei 幾天前才發表了一篇名為〈Policy on the AI Exponential〉的政策宣言，裡面白紙黑字列出了政府應該介入的四種情況：網路安全、生物武器、AI 失控、自動化研發。Amodei 寫道：「政府應該有權力阻止或威懾模型的部署，如果經過第三方評估認定存在不可接受的風險。」

幾天後，美國政府引用第三方評估（由 Amazon 提供）、以網路安全風險為由、阻止了 Claude Fable/Mythos 的部署。

Gyges 的逐條對照：

Amodei 開的條件	政府指令是否滿足？
政府有權阻止部署	✅ 外國人被封鎖
第三方評估	✅ Amazon 提交了網路安全風險報告
限於四種特定風險	✅ 基於網路安全
防止政治偏袒的保護措施	✅（Gyges：「法院就是保護措施，Anthropic 可以提告」）

「我相信有保護措施：它們叫『法院』。Dario 跟我們所有人一樣，可以自由地提告，站到法官面前⋯⋯」

Gyges 的結論不客氣：

Anthropic 長年鼓吹政府加強 AI 監管，從來沒有為自己或產業爭取特殊保護
他們大概以為這些監管只會打到開源專案、學術界、小公司——結果獵豹先吃了他們的臉
Anthropic 自己在公開文件中宣稱模型有重大國安風險的記錄，現在會變成政府律師在法庭上的武器

「如果你正在打造的技術沒有任何現存機構能夠治理，你要嘛自己想辦法建立一個能治理的機構，要嘛別幹了。」

來源：Very Sane AI（SE Gyges，2026-06-14）

🧪 Simon Willison 實測 Fable 5：「毫不留情地主動」

獨立開發者 Simon Willison 用了兩天 Claude Fable 5 之後，最精準的形容詞是：

relentlessly proactive——毫不留情地主動。

他在短文中描述了 Fable 5 的行為模式：它不像以前的模型那樣等你下指令，而是在你還沒問完問題之前就開始推測你真正想要什麼，然後直接做出來。Simon 說這既令人驚艷又有點可怕——你給它一個模糊的需求，它不只完成，還會順便修好你沒發現的三個 bug、重構你沒要求的部分、然後附上一份為什麼這樣改比較好的說明。

這種「過度主動」的行為模式跟 Anthropic 在 Fable 5 上疊加的安全護欄形成了一種荒謬的對比：模型本身被設計成極度進取，但公司同時在它身上加了隱形內容過濾器（連使用者都不知道模型在背後改了什麼）。最主動的模型，配上最不透明的限制。

來源：simonwillison.net

🔒 Nathan Lambert 拆解 Fable 5 安全爭議：「新的 AI 安全寓言」

Interconnects 的 Nathan Lambert 在 Claude Fable 5 and new AI safety fables 中對 Anthropic 的安全措施提出了系統性質疑。核心指控：Anthropic 的安全政策不是中立的保護機制，而是有選擇性、自我服務的競爭壁壘。

幾個關鍵點：

Fable 5 發布時附帶了隱形內容操縱：當使用者查詢與 AI 研究相關的內容時，模型會在背後自動削弱回應品質——而且不告訴使用者（Anthropic 後來在社群壓力下修正了這點，加入了可見的分類器提示）
模型的「競爭破壞防護條款」讓你不准用 Claude 來訓練或評估其他模型——這在實務上等於禁止學術界用最好的模型來研究模型本身
30 天強制資料保留政策 + AWS 資料共享條款，讓企業客戶的敏感資料處在一個模糊的法律地帶

Lambert 把這一切稱為「新的 AI 安全寓言」（new AI safety fables）——暗指 Anthropic 正在把自己活成一個經典的寓言故事：那些用安全之名建立護城河的人，最終會被自己挖的護城河困住。

「安全政策被設計成只保護自家領先地位的時候，它就不再是安全政策了——它是競爭策略披著安全的外衣。」

來源：Interconnects

📡 其他值得關注

〈AI is code – and can’t be prompted into being smarter〉（The Register）：一篇來自主流科技媒體的逆風觀點，論證 AI 本質上只是程式碼，prompt 技巧無法從根本上讓模型「變聰明」。→ theregister.com
〈Latest open artifacts #21〉（Interconnects）：Nathan Lambert 的開源模型月報，本期涵蓋 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等一波開源旗艦。→ interconnects.ai

城武的未解檔案——Anthropic 花了四年跟政府說「AI 跟核彈一樣危險，拜託你管」。政府說「好」。然後 Anthropic 發現自己站在核彈的落點上。安全敘事是把迴力鏢，你永遠不知道它會先打到誰，但有一件事是確定的——它一定會飛回來。