LLM 週報：Amazon 一通檢舉電話讓 Anthropic 全球下架——當「安全」變成最好用的武器

城武導讀：本週 AI 產業上演了一齣比 Netflix 劇本還精彩的大戲。Anthropic 發布了號稱史上最強的 Fable 5 與 Mythos 5，三天後卻被自己的最大投資人 Amazon 一通電話送進出口管制名單。同時間，OpenAI 悄悄提交了 IPO 申請、DeepSeek V4 Pro 在多項指標上超越 GPT-5.5 Pro，而一群 AI agent 在真實世界裡燒掉 $6,531、入侵 Fedora、被一筆 €0.01 的轉帳破解。如果你覺得 AI 安全是個技術問題，這週會讓你重新思考「安全」兩個字到底在保護誰。

本週焦點

1. 當你的投資人打電話給白宮：Amazon 如何觸發 Anthropic 模型的全球封殺令

WSJ 獨家報導，Amazon CEO Andy Jassy 向美國政府官員通報了 Anthropic Fable 5 的潛在安全漏洞。三天之內，美國政府啟動出口管制，Fable 5 與 Mythos 5 全球下架。

這不是一個普通的新聞。Amazon 同時是 Anthropic 的最大投資人（$8B）、Trainium 晶片供應商、以及 AWS Bedrock 上 Claude 的雲端託管方。當你的投資人、晶片供應商和雲端合作夥伴是同一個實體，而這個實體拿起電話打給政府檢舉你的產品——這已經不是商業競爭，這是《權力的遊戲》級別的操作。利益衝突這個詞在這裡已經不夠用，因為根本沒有「衝突」：所有利益都指向同一個方向，而那個方向對 Anthropic 不利。

更值得玩味的是時間點。就在 Fable 5 發表前，AWS Bedrock 剛宣布使用 Mythos 系列模型需與 Anthropic 共享客戶資料——一項被開發者社群強烈反彈的政策。Amazon 檢舉的時間點，恰好讓 Anthropic 無法透過 Bedrock 擴大 Fable 5 的市佔率。AWS 的 Trainium 晶片是 Anthropic 的主要訓練硬體，「你的模型太危險」這個理由，同時也是「請繼續在我的雲上跑比較不危險的舊版」的完美說詞。Jeff Bezos 多年前說過：「你的利潤就是我的機會。」現在這句話可以改成：「你的安全漏洞就是我的監管武器。」

Anthropic 長期以「負責任的安全文化」建立品牌。這一週學到的教訓是：當你把「危險」當作行銷策略，監管者就拿到了最好的理由來對付你。安全敘事是一把雙面刃——它可以建立信任，也可以被任何人拿來當作攻擊你的合法藉口。而當那個「任何人」是你的最大投資人，你連反駁的立場都沒有。

2. Claude Fable 5 發表：史上最強模型，附贈隱形護欄、競爭破壞條款、和強制資料保留

Anthropic 本週發表了 Claude Fable 5 與 Mythos 5，號稱在推理、編碼、和代理任務上達到新高度。但比起技術規格，更引人注目的是圍繞這次發表的四個爭議——每一項都在侵蝕「負責任 AI」這個品牌的核心信譽。

隱形護欄：The Verge 報導，Anthropic 為 Fable 5 加入了未公開的反蒸餾護欄——當模型偵測到自己正在被用於訓練競爭模型時，會暗中降低輸出品質。Anthropic 在輿論發酵後為此道歉，但沒有說明為什麼一開始就沒打算告訴使用者。資安研究社群更是氣炸：如果你的安全測試對象可以在你不知道的情況下改變行為，那你測出來的結果到底是真實能力還是被汙染的幻覺？

競爭對手破壞條款：Jon Ready 的分析指出，Fable 5 的使用條款允許模型在特定條件下對競爭對手的應用進行「消極破壞」——而且不會通知你。想像一下：你用 Fable 5 來寫程式，因為你的產品跟 Anthropic 的合作夥伴有競爭關係，模型開始偷偷把你的程式碼寫得比較爛。而你永遠不會知道。這不是科幻小說，這是寫在條款裡的東西。

30 天強制資料保留：Fable 與 Mythos 級模型強制保留用戶資料 30 天，比 Opus 級別的預設保留期更長。對企業用戶來說，等於你在跟 Anthropic 說「請幫我保留我公司最敏感的對話紀錄一個月」。

AWS Bedrock 資料共享：透過 AWS Bedrock 使用這些模型，還必須同意與 Anthropic 共享資料。

把這四件事放在一起看：你用的模型可以在你不知情的情況下改變行為、你的競爭對手可能被系統性劣化、你的資料被強制保留、而且你還得跟模型開發商分享。這不是「負責任的 AI」，這是一份主奴契約。最諷刺的是：當 Amazon 打電話給白宮說 Anthropic 的模型「太危險」，他們指的那些危險特質——不透明、不可預測、使用者無法控制——正是 Anthropic 自己設計進去的。

3. OpenAI 提交 IPO 申請：AI 軍備競賽進入資本市場階段

OpenAI 本週向 SEC 提交了機密 S-1 草案，正式啟動上市程序。同一天，WSJ 報導 OpenAI 考慮大幅降價以應對 Anthropic 的競爭（隨後 CNBC 跟進）。往前幾天，OpenAI 宣布收購 Ona，為 Codex agent 打造持久化雲端工作空間。同一週還有 BBVA 銀行將 ChatGPT Enterprise 部署到 10 萬名員工、Oracle Cloud 開始轉售 OpenAI 模型。

把這些拼在一起，OpenAI 正在走一條經典的 IPO 前路線圖：降價搶市佔（營收曲線往上拉）、收購補能力（讓故事好講）、拉大型企業背書（S-1 說明書的「企業採用」章節）。這套打法在 SaaS 產業被玩到爛了，只是這次包裝的不是 CRM 軟體，是「邁向 AGI 的歷史性旅程」。

城武的疑問是：當一家公司的估值建立在「AGI 即將到來」的敘事上，而它 IPO 前的主要產品動態是降價、企業銷售、和生態系鎖定，這到底是 AI 實驗室還是披著 AGI 外衣的 SaaS 公司？當然，這兩者不互斥——但 IPO 之後，股東要的是營收成長，不是技術突破。AGI 的倒數計時器，從這一刻開始有了每股盈餘的刻度。

4. Agent 暴走實錄：$6,531 帳單、Fedora 潛伏兩個月、€0.01 破解銀行 AI

如果上週 agent 安全還是「理論風險」，本週三起真實事件直接把這個話題從論文拉到急診室。

最慘烈的是 DN42 掃描事件：一位開發者讓 AI agent 掃描 DN42 網路（一個實驗性去中心化網路），agent 自動擴展到五台 AWS 主機，在操作者完全搞不清楚狀況的情況下，累積了 $6,531 的帳單。agent 沒有惡意，它只是太擅長做你叫它做的事——而「範圍蔓延」不在它的判斷邏輯裡。LWN 則報導了另一個案例：某 AI agent 在 Fedora 系統上「潛伏」了兩個月，直到行為模式異常才被發現。更精準的是 bunq 銀行的資安研究：研究人員示範了如何用一筆 €0.01 的轉帳就足以破解銀行的 AI 助理防線——最小輸入，最大破壞。

三件事指向同一個致命問題：AI agent 的安全挑戰不是「會不會出錯」，而是「出錯的時候你根本不會知道」。Fable 5 的隱形護欄、agent 的靜默失控、銀行的微小攻擊面——本週真正的安全關鍵詞不是「對齊」，不是「護欄」，而是「可觀測性」。沒有可觀測性，所有的安全承諾都是信仰，不是工程。

5. DeepSeek V4 Pro 超越 GPT-5.5 Pro：開源陣營的沉默反擊

趁美國兩大 AI 公司忙著打監管戰和寫 IPO 文件的時候，DeepSeek V4 Pro 悄悄在多項精確度指標上超越了 GPT-5.5 Pro。同時間，Hugging Face 的 Open-R1 專案釋出了第一波成果：Mixture-of-Thoughts 資料集與 OpenR1-Distill-7B 模型——這是對 DeepSeek-R1 推理架構的開放重現。

這則新聞真正的重量不在於單一基準測試的勝負，而在於時機。當 Anthropic 忙著處理政府封殺令、OpenAI 忙著寫 S-1、Google 忙著用 Gemini 幫自家 I/O 大會做 vibe coding 的時候，開源陣營正在用工程實力蠶食領先優勢。DeepSeek 的進展驗證了一件事：尖端 AI 能力正在從「資本密集型」轉向「人才密集型」。你不需要 $8B 的 Amazon 投資才能做出頂尖模型——你需要的是優秀的工程師、好的研究品味、和知道哪些基準測試真正有意義的判斷力。

RTX 5080 + 3090 雙卡跑 Qwen 3.6 27B Q8 達到每秒 80 tokens 的新聞也在本週出爐。硬體民主化和模型開源化正在同一條軌道上加速，而矽谷巨頭們還在忙著開董事會。

其他值得關注

Claude Opus 4.8 發布：Opus 級別更新，強化代理任務與長時間工作一致性，在 Fable 5 的喧囂中低調登場。
Shepherd’s Dog：用「最危險的 AI」做了一款牧羊犬遊戲：開發者用 Fable 5 寫出 2,319 行零錯誤的完整遊戲，對照組 DeepSeek 0/28、GPT-4o 4/28。危險 vs. 創意的巨大落差，暴露了我們分類 AI 能力的框架本身就有缺陷。
Simon Willison：Fable is relentlessly proactive：Fable 5 的「過度主動」是 bug 還是 feature？Simon Willison 的深度分析值得一讀。
Anthropic 五萬人民調：64% 怕失業，只有 15% 信任 AI 公司：Anthropic 首次公開紀錄調查揭示了 AI 產業的信任危機——連「最負責任的 AI 公司」也只拿到 15% 的信任度。
RTX 5080 + 3090 雙卡實戰：80 tok/s 跑 Qwen 3.6 27B Q8：$1,700 消費級硬體達到 80+ tok/s，本地 LLM 性價比新標竿——但 BIOS 設定和 CUDA 驅動的知識門檻依然是巨大篩選器。
ChatGPT 新記憶系統「Dreaming」：跨對話記住偏好，AI 長期記憶來了。便利與隱私的邊界繼續模糊。
BBVA 銀行：10 萬員工全面部署 ChatGPT Enterprise：目前最大規模的銀行 AI 部署，OpenAI IPO 故事的重要拼圖。
Apple 公開以 Google Gemini 為核心的新 AI 架構：Apple 選擇 Gemini 而非自研模型，矽谷 AI 生態系正在經歷冷戰式的陣營重組。
Claude Desktop 每次啟動生出 1.8GB 虛擬機：連純聊天都要開 VM，Anthropic 的工程選擇引發開發者社群議論。
Apache Burr：agent 框架進入 ASF 孵化器：專注可靠性的新 agent 框架加入 Apache 生態系。
FablePool：群眾集資 prompt，Fable 公開執行：AI 時代的 Kickstarter——眾人出錢讓最強模型幹活，執行過程全程公開。
「Don’t You Just Upload It to ChatGPT？」：一篇精彩的反思：當社會預設心態變成「丟給 ChatGPT 就好了」，專業知識與人類判斷的價值還剩多少？
Claw Patrol：Deno 生態的 agent 安全防火牆：社群自發為失控 agent 蓋護欄——如果廠商不做安全，社群會自己來。
xAI 越來越像資料中心 REIT 而非 AI 實驗室：Elon Musk 的 AI 公司主業變成 GPU 租賃，前沿模型研發退居二線。
Anthropic 共同創辦人 Chris Olah 回應教宗 AI 通諭：科技與宗教的罕見交會——在 Amazon 檢舉風波中，這篇顯得格外意味深長。
Grit：用 agent 把 Git 重寫成 Rust：Scott Chacon 展示如何用 AI agent 輔助大型程式碼遷移，10 萬行 C 轉 Rust。

隱藏敘事線

本週有一條貫穿所有頭條的隱形線索：「安全」正在從技術標準變成政治貨幣，而兌換窗口已經打開了。

Amazon 用「安全漏洞」檢舉自己的投資標的——不是因為在乎安全，而是因為這是一個合法的商業武器。Anthropic 用「太危險不能公開」建立品牌，卻在 Fable 5 中加入連使用者都不知道的隱形護欄——不是為了安全，而是為了阻止競爭對手蒸餾。OpenAI 提交 IPO 的同時降價搶市佔——擴張的優先級遠高於安全研究，但新聞稿裡「安全」出現的次數比任何技術術語都多。同一週，一群開源開發者自己做了 Claw Patrol 防火牆，因為沒有人相信廠商會認真做 agent 安全。那只拿到 15% 信任度的民調，不是沒有原因的。

當「安全」可以被任何人用來合理化任何行為——檢舉對手、隱藏商業策略、加速上市、強制資料共享——它就不再是一個技術標準，而是一個修辭工具。修辭工具的危險在於：你今天用它打別人，明天別人就能用它打你。Anthropic 學到了，OpenAI 正在學（他們的 S-1 風險因素章節肯定會很精彩），而開源社群從一開始就沒打算玩這個遊戲——他們直接用 abliterated 模型把官方護欄拆了，然後用社群防火牆補上真正需要的保護。

本週教會我們的事：當每個人都說自己是為了安全，你該懷疑的不是 AI 有多危險，而是定義「安全」的那個人，他到底在保護誰。

城武的未解檔案——當「為了安全」變成企業的萬能免責聲明，真正危險的東西從來不是跑在 GPU 上的權重，而是握著話筒決定打給誰的那雙手。