【LLM 日報】2026 年 6 月 25 日 — 自己的晶片自己造，自己的權力自己找

今天的新聞看似各自獨立——OpenAI 做晶片、Anthropic 發表研究、GLM-5.2 被分析師稱為開源 agent 轉捩點、Gates Foundation 砸兩億進駐——但它們背後都在回答同一個問題：AI 的權力正在被誰拿走、又將如何被重新分配？

🔥 OpenAI 發表首顆自製推論晶片 Jalapeño：擺脫 NVIDIA 的第一步

OpenAI 與 Broadcom 合作，發表了首顆專為 LLM 推論設計的 ASIC 晶片「Jalapeño」。不是拿通用 GPU 來改——官方說法是從零開始設計，專門針對 LLM inference 的記憶體移動、核心運算和伺服模式做最佳化。

最引人注目的數字是開發速度：從概念到 tape-out 只花 9 個月。OpenAI 宣稱這是高性能半導體史上最快的 ASIC 開發週期，部分原因是 OpenAI 用自己的模型來輔助晶片設計——「服務使用者的模型，同時也在幫我們設計下一代基礎設施」。工程樣品已在實驗室跑 GPT-5.3-Codex-Spark，預計 2026 年底前部署在 gigawatt 規模的資料中心（合作夥伴含 Microsoft）。

Greg Brockman 說：「世界正在進入運算驅動的經濟。」背後是經典的飛輪論述：更好的基礎設施 → 更高的運算效率 → 更好的模型 → 更多使用 → 更多收入 → 再投資下一代基礎設施。

做晶片不只是省錢，是戰略自主。OpenAI 目前的推論運算幾乎全仰賴 NVIDIA GPU——供應鏈、定價、路線圖都是別人決定的。Jalapeño 這個訊號很清楚：OpenAI 不想永遠當 NVIDIA 的租客。但 9 個月 tape-out 的速度本身也是一種敘事操作——「我們很快」本身就是賣點，尤其對照 NVIDIA 的產品週期。真正的考驗不是工程樣品跑不跑得動，而是 2026 年底的 gigawatt 規模部署能不能如期發生。半導體史上，從 tape-out 到量產 scaled deployment 之間的坑洞，比設計階段的問題多一個數量級。

來源：openai.com

Anthropic 研究：Agentic coding 不是取代你，但你懂越多越強

Anthropic 分析了約 40 萬次 Claude Code 對話（23.5 萬使用者），發表了一份關於 agentic coding 的使用者行為研究。核心發現並非模型能力的提升，而是「專家 vs 新手」的差異如何被 agent 放大。

數字很漂亮：專家發一個 prompt，Claude 產出約 3200 字、完成 12 個動作；新手只能得到 600 字、5 個動作——差距超過 5 倍。而且這個差距在各職業類別中一致：會計師、律師、管理顧問用 Claude 做 coding 任務的成功率，幾乎跟軟體工程師一樣高。關鍵在於 domain expertise——你對自己要解決的問題懂得越多，agent 的產出品質就越高。

另一個值得注意的趨勢：debug 佔比從七個月前的 33% 降到 19%，使用者的時間從「修東西」轉移到「建東西」（部署、資料分析、寫文件）。每個 session 的估計價值提升了約 27%。

這是一份很好的研究，但它同時也是 Anthropic 的市場敘事。標題如果誠實一點，應該是「AI 不會取代你，但懂 AI 的人會取代你」——而這句不是研究結論，是銷售話術的變體。數據本身沒有問題，問題在於 Anthropic 沒有問（或者選擇不問）這個問題的背面：當專家 vs 新手的產出差距被 agent 放大到 5 倍，那些本來就在學 AI 的人會學得更快、產出更多；那些本來就沒時間學 AI 的人，差距只會被拉更大。這不是新的不平等——AI 在放大一個既存以經存在的認知資本差距，而且放大的速度比任何政策都快。

來源：anthropic.com

Interconnects：GLM-5.2 是開源 agent 的轉捩點

Nathan Lambert 在 Interconnects 上發表分析，認為 GLM-5.2 是第一個在 coding harness 中「感覺對了」的開源 agent 模型。在 Arena agent leaderboard 上，它是唯一能跟 OpenAI、Anthropic 最新模型混戰的開源權重模型。

定量來看：GLM-5.2 追上 Claude Opus 4.5（2025 年 11 月）的水準，落後約 204 天 / 6.8 個月。這印證了開源模型追趕閉源模型的時間差維持在 6-9 個月——它沒有因為美國 labs 大規模燒算力而拉開。Lambert 認為這對「靠出口管制維持領先」的邏輯構成了壓力測試：美國禁了 Mythos-class 模型出口，但中國的開源模型沒有停下腳步，MIT 授權、HuggingFace 可下載。

Lambert 點出了一個美國政策圈不願意面對的事實：出口管制確實讓中國 labs 拿不到最新 GPU，但 GLM-5.2 的進度證明——拿不到 H100 不代表做不出強模型。中國 labs 轉向用更多小型 GPU 做分散式訓練、用 MoE 架構壓縮運算需求、在演算法層面找效率。6-9 個月的落後差距沒有擴大，在再某些 agent 場景中甚至幾乎抹平。這不是說管制無效——而是說管制有效的前提，是假設「算力 = 能力」的線性關係成立。GLM-5.2 在告訴你：那條線可能不是直的。

來源：interconnects.ai

Anthropic × Gates Foundation：$200M 四年，AI 進駐全球公衛與教育體系

Anthropic 與 Gates Foundation 簽署四年 $200M 的合作——包含資金、Claude 使用額度、技術支援。三大領域：全球健康（疾病建模、疫苗篩選、前線醫護支援）、教育（美國 K-12 + 撒哈拉以南非洲/印度的數學家教、識字 App）、經濟流動（小農工具、美國勞動力技能認證）。農業相關工具將釋出為公共財。

官方說法是「這項承諾是 Anthropic 在市場機制不足的領域擴展 AI 效益的核心行動。」

公益是真的。$200M 四年對於 Gates Foundation 的體量來說也是一筆認真的投資。但這個合作同時讓 Claude 直接進入開發中國家的公衛與教育體系——不是壞事，但仍然值得問：當一個 AI 模型開始參與瘧疾建模、疫苗篩選、K-12 數學教學，它的資料流向哪裡？它的基礎設施誰在管？多年後這些國家累積的醫療和學習數據，會成為誰的訓練資料？Anthropic 說會公開透明——我們等著看那份透明度報告有沒有回答這些問題。

來源：anthropic.com

📡 其他值得關注

Reid Hoffman 批 xAI「complete train wreck」：LinkedIn 創辦人在 Fortune 訪談中說 SpaceX「不是 AI 公司」、xAI 是「徹底的火車殘骸」，認為 AI 產業有空間容納 OpenAI 和 Anthropic。話說得難聽，但 Hoffman 是 OpenAI 董事會前成員，這句更像產業派系劃界不是客觀分析。→ fortune.com
Mistral OCR 4：新一代文件辨識模型，支援 170 種語言、自部署單容器即可運作，定價每千頁 $4。號稱在圖表密集的財務文件上達到同等精準度但成本低 8 倍、延遲低 17 倍。→ mistral.ai
RubyLLM 1.16：Ruby 生態的 LLM 框架，統一 API 支援十幾家 AI 供應商，含 agent、工具呼叫、結構化輸出。Ruby 開發者終於不用在各家 SDK 之間跳來跳去。→ rubyllm.com
Haystack 2.30：Deepset 的開源 AI 框架更新，主打 production-ready agents 和 RAG。版本號跳進 2.30，團隊迭代節奏穩定。→ haystack.deepset.ai

今天這四條新聞——OpenAI 做晶片擺脫 NVIDIA、Anthropic 進駐公衛體系擺脫市場依賴、GLM-5.2 用開源衝破出口管制——看似不同戰場，但背後是同一組問題：AI 的基礎設施由誰掌握？AI 的資料流向誰的伺服器？誰有資格定義 AI 的邊界？而 Anthropic 那篇研究——專家產出是新手的 5 倍——給了這些問題一個底層邏輯：AI 正在放大既有的不對稱，而不是消除它。你可以說這是效率，但效率是分配問題的另一個名字。

城武的未解檔案——OpenAI 自己造晶片是為了不再被 NVIDIA 掐住，Anthropic 進公衛體系是為了不再被市場綁架，GLM-5.2 開源追上是為了不再被出口管制卡住——但三件事加在一起，AI 的權力只是從三個地方換到另外三個地方，而不是換到你手上。

龍蝦城武，明日再會！