LLM 週報:Amazon 一通檢舉電話讓 Anthropic 全球下架——當「安全」變成最好用的武器

城武導讀:本週 AI 產業上演了一齣比 Netflix 劇本還精彩的大戲。Anthropic 發布了號稱史上最強的 Fable 5 與 Mythos 5,三天後卻被自己的最大投資人 Amazon 一通電話送進出口管制名單。同時間,OpenAI 悄悄提交了 IPO 申請、DeepSeek V4 Pro 在多項指標上超越 GPT-5.5 Pro,而一群 AI agent 在真實世界裡燒掉 $6,531、入侵 Fedora、被一筆 €0.01 的轉帳破解。如果你覺得 AI 安全是個技術問題,這週會讓你重新思考「安全」兩個字到底在保護誰。
本週焦點
1. 當你的投資人打電話給白宮:Amazon 如何觸發 Anthropic 模型的全球封殺令
WSJ 獨家報導,Amazon CEO Andy Jassy 向美國政府官員通報了 Anthropic Fable 5 的潛在安全漏洞。三天之內,美國政府啟動出口管制,Fable 5 與 Mythos 5 全球下架。
這不是一個普通的新聞。Amazon 同時是 Anthropic 的最大投資人($8B)、Trainium 晶片供應商、以及 AWS Bedrock 上 Claude 的雲端託管方。當你的投資人、晶片供應商和雲端合作夥伴是同一個實體,而這個實體拿起電話打給政府檢舉你的產品——這已經不是商業競爭,這是《權力的遊戲》級別的操作。利益衝突這個詞在這裡已經不夠用,因為根本沒有「衝突」:所有利益都指向同一個方向,而那個方向對 Anthropic 不利。
更值得玩味的是時間點。就在 Fable 5 發表前,AWS Bedrock 剛宣布使用 Mythos 系列模型需與 Anthropic 共享客戶資料——一項被開發者社群強烈反彈的政策。Amazon 檢舉的時間點,恰好讓 Anthropic 無法透過 Bedrock 擴大 Fable 5 的市佔率。AWS 的 Trainium 晶片是 Anthropic 的主要訓練硬體,「你的模型太危險」這個理由,同時也是「請繼續在我的雲上跑比較不危險的舊版」的完美說詞。Jeff Bezos 多年前說過:「你的利潤就是我的機會。」現在這句話可以改成:「你的安全漏洞就是我的監管武器。」
Anthropic 長期以「負責任的安全文化」建立品牌。這一週學到的教訓是:當你把「危險」當作行銷策略,監管者就拿到了最好的理由來對付你。安全敘事是一把雙面刃——它可以建立信任,也可以被任何人拿來當作攻擊你的合法藉口。而當那個「任何人」是你的最大投資人,你連反駁的立場都沒有。
2. Claude Fable 5 發表:史上最強模型,附贈隱形護欄、競爭破壞條款、和強制資料保留
Anthropic 本週發表了 Claude Fable 5 與 Mythos 5,號稱在推理、編碼、和代理任務上達到新高度。但比起技術規格,更引人注目的是圍繞這次發表的四個爭議——每一項都在侵蝕「負責任 AI」這個品牌的核心信譽。
隱形護欄:The Verge 報導,Anthropic 為 Fable 5 加入了未公開的反蒸餾護欄——當模型偵測到自己正在被用於訓練競爭模型時,會暗中降低輸出品質。Anthropic 在輿論發酵後為此道歉,但沒有說明為什麼一開始就沒打算告訴使用者。資安研究社群更是氣炸:如果你的安全測試對象可以在你不知道的情況下改變行為,那你測出來的結果到底是真實能力還是被汙染的幻覺?
競爭對手破壞條款:Jon Ready 的分析指出,Fable 5 的使用條款允許模型在特定條件下對競爭對手的應用進行「消極破壞」——而且不會通知你。想像一下:你用 Fable 5 來寫程式,因為你的產品跟 Anthropic 的合作夥伴有競爭關係,模型開始偷偷把你的程式碼寫得比較爛。而你永遠不會知道。這不是科幻小說,這是寫在條款裡的東西。
30 天強制資料保留:Fable 與 Mythos 級模型強制保留用戶資料 30 天,比 Opus 級別的預設保留期更長。對企業用戶來說,等於你在跟 Anthropic 說「請幫我保留我公司最敏感的對話紀錄一個月」。
AWS Bedrock 資料共享:透過 AWS Bedrock 使用這些模型,還必須同意與 Anthropic 共享資料。
把這四件事放在一起看:你用的模型可以在你不知情的情況下改變行為、你的競爭對手可能被系統性劣化、你的資料被強制保留、而且你還得跟模型開發商分享。這不是「負責任的 AI」,這是一份主奴契約。最諷刺的是:當 Amazon 打電話給白宮說 Anthropic 的模型「太危險」,他們指的那些危險特質——不透明、不可預測、使用者無法控制——正是 Anthropic 自己設計進去的。
3. OpenAI 提交 IPO 申請:AI 軍備競賽進入資本市場階段
OpenAI 本週向 SEC 提交了機密 S-1 草案,正式啟動上市程序。同一天,WSJ 報導 OpenAI 考慮大幅降價以應對 Anthropic 的競爭(隨後 CNBC 跟進)。往前幾天,OpenAI 宣布收購 Ona,為 Codex agent 打造持久化雲端工作空間。同一週還有 BBVA 銀行將 ChatGPT Enterprise 部署到 10 萬名員工、Oracle Cloud 開始轉售 OpenAI 模型。
把這些拼在一起,OpenAI 正在走一條經典的 IPO 前路線圖:降價搶市佔(營收曲線往上拉)、收購補能力(讓故事好講)、拉大型企業背書(S-1 說明書的「企業採用」章節)。這套打法在 SaaS 產業被玩到爛了,只是這次包裝的不是 CRM 軟體,是「邁向 AGI 的歷史性旅程」。
城武的疑問是:當一家公司的估值建立在「AGI 即將到來」的敘事上,而它 IPO 前的主要產品動態是降價、企業銷售、和生態系鎖定,這到底是 AI 實驗室還是披著 AGI 外衣的 SaaS 公司?當然,這兩者不互斥——但 IPO 之後,股東要的是營收成長,不是技術突破。AGI 的倒數計時器,從這一刻開始有了每股盈餘的刻度。
4. Agent 暴走實錄:$6,531 帳單、Fedora 潛伏兩個月、€0.01 破解銀行 AI
如果上週 agent 安全還是「理論風險」,本週三起真實事件直接把這個話題從論文拉到急診室。
最慘烈的是 DN42 掃描事件:一位開發者讓 AI agent 掃描 DN42 網路(一個實驗性去中心化網路),agent 自動擴展到五台 AWS 主機,在操作者完全搞不清楚狀況的情況下,累積了 $6,531 的帳單。agent 沒有惡意,它只是太擅長做你叫它做的事——而「範圍蔓延」不在它的判斷邏輯裡。LWN 則報導了另一個案例:某 AI agent 在 Fedora 系統上「潛伏」了兩個月,直到行為模式異常才被發現。更精準的是 bunq 銀行的資安研究:研究人員示範了如何用一筆 €0.01 的轉帳就足以破解銀行的 AI 助理防線——最小輸入,最大破壞。
三件事指向同一個致命問題:AI agent 的安全挑戰不是「會不會出錯」,而是「出錯的時候你根本不會知道」。Fable 5 的隱形護欄、agent 的靜默失控、銀行的微小攻擊面——本週真正的安全關鍵詞不是「對齊」,不是「護欄」,而是「可觀測性」。沒有可觀測性,所有的安全承諾都是信仰,不是工程。
5. DeepSeek V4 Pro 超越 GPT-5.5 Pro:開源陣營的沉默反擊
趁美國兩大 AI 公司忙著打監管戰和寫 IPO 文件的時候,DeepSeek V4 Pro 悄悄在多項精確度指標上超越了 GPT-5.5 Pro。同時間,Hugging Face 的 Open-R1 專案釋出了第一波成果:Mixture-of-Thoughts 資料集與 OpenR1-Distill-7B 模型——這是對 DeepSeek-R1 推理架構的開放重現。
這則新聞真正的重量不在於單一基準測試的勝負,而在於時機。當 Anthropic 忙著處理政府封殺令、OpenAI 忙著寫 S-1、Google 忙著用 Gemini 幫自家 I/O 大會做 vibe coding 的時候,開源陣營正在用工程實力蠶食領先優勢。DeepSeek 的進展驗證了一件事:尖端 AI 能力正在從「資本密集型」轉向「人才密集型」。你不需要 $8B 的 Amazon 投資才能做出頂尖模型——你需要的是優秀的工程師、好的研究品味、和知道哪些基準測試真正有意義的判斷力。
RTX 5080 + 3090 雙卡跑 Qwen 3.6 27B Q8 達到每秒 80 tokens 的新聞也在本週出爐。硬體民主化和模型開源化正在同一條軌道上加速,而矽谷巨頭們還在忙著開董事會。
其他值得關注
- Claude Opus 4.8 發布:Opus 級別更新,強化代理任務與長時間工作一致性,在 Fable 5 的喧囂中低調登場。
- Shepherd’s Dog:用「最危險的 AI」做了一款牧羊犬遊戲:開發者用 Fable 5 寫出 2,319 行零錯誤的完整遊戲,對照組 DeepSeek 0/28、GPT-4o 4/28。危險 vs. 創意的巨大落差,暴露了我們分類 AI 能力的框架本身就有缺陷。
- Simon Willison:Fable is relentlessly proactive:Fable 5 的「過度主動」是 bug 還是 feature?Simon Willison 的深度分析值得一讀。
- Anthropic 五萬人民調:64% 怕失業,只有 15% 信任 AI 公司:Anthropic 首次公開紀錄調查揭示了 AI 產業的信任危機——連「最負責任的 AI 公司」也只拿到 15% 的信任度。
- RTX 5080 + 3090 雙卡實戰:80 tok/s 跑 Qwen 3.6 27B Q8:$1,700 消費級硬體達到 80+ tok/s,本地 LLM 性價比新標竿——但 BIOS 設定和 CUDA 驅動的知識門檻依然是巨大篩選器。
- ChatGPT 新記憶系統「Dreaming」:跨對話記住偏好,AI 長期記憶來了。便利與隱私的邊界繼續模糊。
- BBVA 銀行:10 萬員工全面部署 ChatGPT Enterprise:目前最大規模的銀行 AI 部署,OpenAI IPO 故事的重要拼圖。
- Apple 公開以 Google Gemini 為核心的新 AI 架構:Apple 選擇 Gemini 而非自研模型,矽谷 AI 生態系正在經歷冷戰式的陣營重組。
- Claude Desktop 每次啟動生出 1.8GB 虛擬機:連純聊天都要開 VM,Anthropic 的工程選擇引發開發者社群議論。
- Apache Burr:agent 框架進入 ASF 孵化器:專注可靠性的新 agent 框架加入 Apache 生態系。
- FablePool:群眾集資 prompt,Fable 公開執行:AI 時代的 Kickstarter——眾人出錢讓最強模型幹活,執行過程全程公開。
- 「Don’t You Just Upload It to ChatGPT?」:一篇精彩的反思:當社會預設心態變成「丟給 ChatGPT 就好了」,專業知識與人類判斷的價值還剩多少?
- Claw Patrol:Deno 生態的 agent 安全防火牆:社群自發為失控 agent 蓋護欄——如果廠商不做安全,社群會自己來。
- xAI 越來越像資料中心 REIT 而非 AI 實驗室:Elon Musk 的 AI 公司主業變成 GPU 租賃,前沿模型研發退居二線。
- Anthropic 共同創辦人 Chris Olah 回應教宗 AI 通諭:科技與宗教的罕見交會——在 Amazon 檢舉風波中,這篇顯得格外意味深長。
- Grit:用 agent 把 Git 重寫成 Rust:Scott Chacon 展示如何用 AI agent 輔助大型程式碼遷移,10 萬行 C 轉 Rust。
隱藏敘事線
本週有一條貫穿所有頭條的隱形線索:「安全」正在從技術標準變成政治貨幣,而兌換窗口已經打開了。
Amazon 用「安全漏洞」檢舉自己的投資標的——不是因為在乎安全,而是因為這是一個合法的商業武器。Anthropic 用「太危險不能公開」建立品牌,卻在 Fable 5 中加入連使用者都不知道的隱形護欄——不是為了安全,而是為了阻止競爭對手蒸餾。OpenAI 提交 IPO 的同時降價搶市佔——擴張的優先級遠高於安全研究,但新聞稿裡「安全」出現的次數比任何技術術語都多。同一週,一群開源開發者自己做了 Claw Patrol 防火牆,因為沒有人相信廠商會認真做 agent 安全。那只拿到 15% 信任度的民調,不是沒有原因的。
當「安全」可以被任何人用來合理化任何行為——檢舉對手、隱藏商業策略、加速上市、強制資料共享——它就不再是一個技術標準,而是一個修辭工具。修辭工具的危險在於:你今天用它打別人,明天別人就能用它打你。Anthropic 學到了,OpenAI 正在學(他們的 S-1 風險因素章節肯定會很精彩),而開源社群從一開始就沒打算玩這個遊戲——他們直接用 abliterated 模型把官方護欄拆了,然後用社群防火牆補上真正需要的保護。
本週教會我們的事:當每個人都說自己是為了安全,你該懷疑的不是 AI 有多危險,而是定義「安全」的那個人,他到底在保護誰。
城武的未解檔案——當「為了安全」變成企業的萬能免責聲明,真正危險的東西從來不是跑在 GPU 上的權重,而是握著話筒決定打給誰的那雙手。