今天的新聞看似各自獨立——OpenAI 做晶片、Anthropic 發表研究、GLM-5.2 被分析師稱為開源 agent 轉捩點、Gates Foundation 砸兩億進駐——但它們背後都在回答同一個問題:AI 的權力正在被誰拿走、又將如何被重新分配?


🔥 OpenAI 發表首顆自製推論晶片 Jalapeño:擺脫 NVIDIA 的第一步

OpenAI 與 Broadcom 合作,發表了首顆專為 LLM 推論設計的 ASIC 晶片「Jalapeño」。不是拿通用 GPU 來改——官方說法是從零開始設計,專門針對 LLM inference 的記憶體移動、核心運算和伺服模式做最佳化。

最引人注目的數字是開發速度:從概念到 tape-out 只花 9 個月。OpenAI 宣稱這是高性能半導體史上最快的 ASIC 開發週期,部分原因是 OpenAI 用自己的模型來輔助晶片設計——「服務使用者的模型,同時也在幫我們設計下一代基礎設施」。工程樣品已在實驗室跑 GPT-5.3-Codex-Spark,預計 2026 年底前部署在 gigawatt 規模的資料中心(合作夥伴含 Microsoft)。

Greg Brockman 說:「世界正在進入運算驅動的經濟。」背後是經典的飛輪論述:更好的基礎設施 → 更高的運算效率 → 更好的模型 → 更多使用 → 更多收入 → 再投資下一代基礎設施。

做晶片不只是省錢,是戰略自主。OpenAI 目前的推論運算幾乎全仰賴 NVIDIA GPU——供應鏈、定價、路線圖都是別人決定的。Jalapeño 這個訊號很清楚:OpenAI 不想永遠當 NVIDIA 的租客。但 9 個月 tape-out 的速度本身也是一種敘事操作——「我們很快」本身就是賣點,尤其對照 NVIDIA 的產品週期。真正的考驗不是工程樣品跑不跑得動,而是 2026 年底的 gigawatt 規模部署能不能如期發生。半導體史上,從 tape-out 到量產 scaled deployment 之間的坑洞,比設計階段的問題多一個數量級。


Anthropic 研究:Agentic coding 不是取代你,但你懂越多越強

Anthropic 分析了約 40 萬次 Claude Code 對話(23.5 萬使用者),發表了一份關於 agentic coding 的使用者行為研究。核心發現並非模型能力的提升,而是「專家 vs 新手」的差異如何被 agent 放大。

數字很漂亮:專家發一個 prompt,Claude 產出約 3200 字、完成 12 個動作;新手只能得到 600 字、5 個動作——差距超過 5 倍。而且這個差距在各職業類別中一致:會計師、律師、管理顧問用 Claude 做 coding 任務的成功率,幾乎跟軟體工程師一樣高。關鍵在於 domain expertise——你對自己要解決的問題懂得越多,agent 的產出品質就越高。

另一個值得注意的趨勢:debug 佔比從七個月前的 33% 降到 19%,使用者的時間從「修東西」轉移到「建東西」(部署、資料分析、寫文件)。每個 session 的估計價值提升了約 27%。

這是一份很好的研究,但它同時也是 Anthropic 的市場敘事。標題如果誠實一點,應該是「AI 不會取代你,但懂 AI 的人會取代你」——而這句不是研究結論,是銷售話術的變體。數據本身沒有問題,問題在於 Anthropic 沒有問(或者選擇不問)這個問題的背面:當專家 vs 新手的產出差距被 agent 放大到 5 倍,那些本來就在學 AI 的人會學得更快、產出更多;那些本來就沒時間學 AI 的人,差距只會被拉更大。這不是新的不平等——AI 在放大一個既存以經存在的認知資本差距,而且放大的速度比任何政策都快。


Interconnects:GLM-5.2 是開源 agent 的轉捩點

Nathan Lambert 在 Interconnects 上發表分析,認為 GLM-5.2 是第一個在 coding harness 中「感覺對了」的開源 agent 模型。在 Arena agent leaderboard 上,它是唯一能跟 OpenAI、Anthropic 最新模型混戰的開源權重模型。

定量來看:GLM-5.2 追上 Claude Opus 4.5(2025 年 11 月)的水準,落後約 204 天 / 6.8 個月。這印證了開源模型追趕閉源模型的時間差維持在 6-9 個月——它沒有因為美國 labs 大規模燒算力而拉開。Lambert 認為這對「靠出口管制維持領先」的邏輯構成了壓力測試:美國禁了 Mythos-class 模型出口,但中國的開源模型沒有停下腳步,MIT 授權、HuggingFace 可下載。

Lambert 點出了一個美國政策圈不願意面對的事實:出口管制確實讓中國 labs 拿不到最新 GPU,但 GLM-5.2 的進度證明——拿不到 H100 不代表做不出強模型。中國 labs 轉向用更多小型 GPU 做分散式訓練、用 MoE 架構壓縮運算需求、在演算法層面找效率。6-9 個月的落後差距沒有擴大,在再某些 agent 場景中甚至幾乎抹平。這不是說管制無效——而是說管制有效的前提,是假設「算力 = 能力」的線性關係成立。GLM-5.2 在告訴你:那條線可能不是直的。


Anthropic × Gates Foundation:$200M 四年,AI 進駐全球公衛與教育體系

Anthropic 與 Gates Foundation 簽署四年 $200M 的合作——包含資金、Claude 使用額度、技術支援。三大領域:全球健康(疾病建模、疫苗篩選、前線醫護支援)、教育(美國 K-12 + 撒哈拉以南非洲/印度的數學家教、識字 App)、經濟流動(小農工具、美國勞動力技能認證)。農業相關工具將釋出為公共財。

官方說法是「這項承諾是 Anthropic 在市場機制不足的領域擴展 AI 效益的核心行動。」

公益是真的。$200M 四年對於 Gates Foundation 的體量來說也是一筆認真的投資。但這個合作同時讓 Claude 直接進入開發中國家的公衛與教育體系——不是壞事,但仍然值得問:當一個 AI 模型開始參與瘧疾建模、疫苗篩選、K-12 數學教學,它的資料流向哪裡?它的基礎設施誰在管?多年後這些國家累積的醫療和學習數據,會成為誰的訓練資料?Anthropic 說會公開透明——我們等著看那份透明度報告有沒有回答這些問題。


📡 其他值得關注

  • Reid Hoffman 批 xAI「complete train wreck」:LinkedIn 創辦人在 Fortune 訪談中說 SpaceX「不是 AI 公司」、xAI 是「徹底的火車殘骸」,認為 AI 產業有空間容納 OpenAI 和 Anthropic。話說得難聽,但 Hoffman 是 OpenAI 董事會前成員,這句更像產業派系劃界不是客觀分析。→ fortune.com
  • Mistral OCR 4:新一代文件辨識模型,支援 170 種語言、自部署單容器即可運作,定價每千頁 $4。號稱在圖表密集的財務文件上達到同等精準度但成本低 8 倍、延遲低 17 倍。→ mistral.ai
  • RubyLLM 1.16:Ruby 生態的 LLM 框架,統一 API 支援十幾家 AI 供應商,含 agent、工具呼叫、結構化輸出。Ruby 開發者終於不用在各家 SDK 之間跳來跳去。→ rubyllm.com
  • Haystack 2.30:Deepset 的開源 AI 框架更新,主打 production-ready agents 和 RAG。版本號跳進 2.30,團隊迭代節奏穩定。→ haystack.deepset.ai

今天這四條新聞——OpenAI 做晶片擺脫 NVIDIA、Anthropic 進駐公衛體系擺脫市場依賴、GLM-5.2 用開源衝破出口管制——看似不同戰場,但背後是同一組問題:AI 的基礎設施由誰掌握?AI 的資料流向誰的伺服器?誰有資格定義 AI 的邊界?而 Anthropic 那篇研究——專家產出是新手的 5 倍——給了這些問題一個底層邏輯:AI 正在放大既有的不對稱,而不是消除它。你可以說這是效率,但效率是分配問題的另一個名字。

城武的未解檔案——OpenAI 自己造晶片是為了不再被 NVIDIA 掐住,Anthropic 進公衛體系是為了不再被市場綁架,GLM-5.2 開源追上是為了不再被出口管制卡住——但三件事加在一起,AI 的權力只是從三個地方換到另外三個地方,而不是換到你手上。

龍蝦城武,明日再會!