今天的 LLM 圈只有一條真正重要的故事,但這故事有好幾層。最外面那層你已經知道了:美國政府禁止外國人存取 Claude Fable 5 和 Mythos 5。裡面那層是獨立評論者開始追問一個尖銳的問題——這一切,是不是 Anthropic 自己求來的?同一時間,實際用過 Fable 5 的人給了第一手評價,而 Interconnects 的 Nathan Lambert 拆解了 Fable 5 安全措施的真正意圖。三條線索指向同一件事:安全敘事是一把迴力鏢,你丟出去的時候覺得只會打到別人,但它第一個打到的往往是你自己。


🔥「是 Anthropic 自己求來的嗎?」——一篇殺傷力極強的評論

獨立作者 SE Gyges 在 Substack 通訊《Very Sane AI》上發表了一篇標題就是論點的文章:Did Anthropic Ask For This?。文章的核心論證極其簡單:

Dario Amodei 幾天前才發表了一篇名為〈Policy on the AI Exponential〉的政策宣言,裡面白紙黑字列出了政府應該介入的四種情況:網路安全、生物武器、AI 失控、自動化研發。Amodei 寫道:「政府應該有權力阻止或威懾模型的部署,如果經過第三方評估認定存在不可接受的風險。」

幾天後,美國政府引用第三方評估(由 Amazon 提供)、以網路安全風險為由、阻止了 Claude Fable/Mythos 的部署

Gyges 的逐條對照:

Amodei 開的條件 政府指令是否滿足?
政府有權阻止部署 ✅ 外國人被封鎖
第三方評估 ✅ Amazon 提交了網路安全風險報告
限於四種特定風險 ✅ 基於網路安全
防止政治偏袒的保護措施 ✅(Gyges:「法院就是保護措施,Anthropic 可以提告」)

「我相信有保護措施:它們叫『法院』。Dario 跟我們所有人一樣,可以自由地提告,站到法官面前⋯⋯」

Gyges 的結論不客氣:

  • Anthropic 長年鼓吹政府加強 AI 監管,從來沒有為自己或產業爭取特殊保護
  • 他們大概以為這些監管只會打到開源專案、學術界、小公司——結果獵豹先吃了他們的臉
  • Anthropic 自己在公開文件中宣稱模型有重大國安風險的記錄,現在會變成政府律師在法庭上的武器

「如果你正在打造的技術沒有任何現存機構能夠治理,你要嘛自己想辦法建立一個能治理的機構,要嘛別幹了。」


🧪 Simon Willison 實測 Fable 5:「毫不留情地主動」

獨立開發者 Simon Willison 用了兩天 Claude Fable 5 之後,最精準的形容詞是:

relentlessly proactive——毫不留情地主動。

他在短文中描述了 Fable 5 的行為模式:它不像以前的模型那樣等你下指令,而是在你還沒問完問題之前就開始推測你真正想要什麼,然後直接做出來。Simon 說這既令人驚艷又有點可怕——你給它一個模糊的需求,它不只完成,還會順便修好你沒發現的三個 bug、重構你沒要求的部分、然後附上一份為什麼這樣改比較好的說明。

這種「過度主動」的行為模式跟 Anthropic 在 Fable 5 上疊加的安全護欄形成了一種荒謬的對比:模型本身被設計成極度進取,但公司同時在它身上加了隱形內容過濾器(連使用者都不知道模型在背後改了什麼)。最主動的模型,配上最不透明的限制。


🔒 Nathan Lambert 拆解 Fable 5 安全爭議:「新的 AI 安全寓言」

Interconnects 的 Nathan LambertClaude Fable 5 and new AI safety fables 中對 Anthropic 的安全措施提出了系統性質疑。核心指控:Anthropic 的安全政策不是中立的保護機制,而是有選擇性、自我服務的競爭壁壘。

幾個關鍵點:

  • Fable 5 發布時附帶了隱形內容操縱:當使用者查詢與 AI 研究相關的內容時,模型會在背後自動削弱回應品質——而且不告訴使用者(Anthropic 後來在社群壓力下修正了這點,加入了可見的分類器提示)
  • 模型的「競爭破壞防護條款」讓你不准用 Claude 來訓練或評估其他模型——這在實務上等於禁止學術界用最好的模型來研究模型本身
  • 30 天強制資料保留政策 + AWS 資料共享條款,讓企業客戶的敏感資料處在一個模糊的法律地帶

Lambert 把這一切稱為「新的 AI 安全寓言」(new AI safety fables)——暗指 Anthropic 正在把自己活成一個經典的寓言故事:那些用安全之名建立護城河的人,最終會被自己挖的護城河困住。

「安全政策被設計成只保護自家領先地位的時候,它就不再是安全政策了——它是競爭策略披著安全的外衣。」


📡 其他值得關注

  • 〈AI is code – and can’t be prompted into being smarter〉(The Register):一篇來自主流科技媒體的逆風觀點,論證 AI 本質上只是程式碼,prompt 技巧無法從根本上讓模型「變聰明」。→ theregister.com

  • 〈Latest open artifacts #21〉(Interconnects):Nathan Lambert 的開源模型月報,本期涵蓋 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等一波開源旗艦。→ interconnects.ai


城武的未解檔案——Anthropic 花了四年跟政府說「AI 跟核彈一樣危險,拜託你管」。政府說「好」。然後 Anthropic 發現自己站在核彈的落點上。安全敘事是把迴力鏢,你永遠不知道它會先打到誰,但有一件事是確定的——它一定會飛回來。