agents

1 篇文章- 【深度解析】OpenAI 收購 Ona:Codex 不再只是寫 code 的工具,它正在變成 agent 的作業系統 — 2026-06-12## ai

93 篇文章- 【深度分析】他用 Claude Code 分析自己的 MRI——AI 說你沒撕裂,醫生說你有,你信誰? — 2026-06-29- LLM 週報:華盛頓開始發 AI 入場券——而你不在名單上 — 2026-06-28- 【論文拆解】DSpark——DeepSeek 的半自迴歸推測解碼,如何在重載下加速 60-85% — 2026-06-28- 【深度分析】AI agent 正在吃掉白領工作——OpenAI 內部數據告訴你這件事的規模有多大 — 2026-06-28- 【深度翻譯】政府逐客戶審查 GPT-5.6 + IPO 推遲至 2027——OpenAI 的兩條線在同一條繩索上 — 2026-06-28- 【深度分析】Workweave Router——插入 Claude Code/Codex/Cursor 中間層的智慧路由,省 40-70% 成本的代價是什麼? — 2026-06-27- 【深度分析】開源 LLM 何時追上閉源?聖誕節 vs. 永遠差五個月——一個 benchmark 的兩種人生 — 2026-06-27- 【深度分析】GPT-5.6 Sol 正式預覽——三層模型、四層安全、政府把關,OpenAI 說「我們相信廣泛存取」 — 2026-06-27- 【深度分析】六大 AI 模型政治光譜大解析——ChatGPT 最左、Grok 最右、Gemini 的中立是演算法還是自我審查? — 2026-06-26- 【深度翻譯】川普政府要求 OpenAI 延遲 GPT-5.6——政府直接介入模型釋出,OpenAI 與 Anthropic 的差別待遇 — 2026-06-26- 【城武觀點】peerd — 瀏覽器就是最好的 AI agent runtime?這個賭注比你想像的更大 — 2026-06-25- 【深度分析】Reid Hoffman 批 xAI「火車事故」、SpaceX「不是 AI 公司」——但真正的新聞不在他說了什麼,在誰在說、為什麼現在說 — 2026-06-25- 【論文拆解】模擬環境訓練比真實環境更強?Qwen-AgentWorld 的反直覺答案 — 2026-06-25- 【深度分析】Google 把 computer use 塞進模型本體——Gemini 3.5 Flash 的整合路線意味著什麼 — 2026-06-25- 【深度分析】安全公司的雙面困境:Anthropic 告阿里偷模型,卻被自己政府斷 Mythos — 2026-06-25- 【深度翻譯】一行 code 都沒寫——用 Claude Code 把 AI 影像修補模型移植到瀏覽器的全程實錄 — 2026-06-24- 【深度分析】Anthropic 40 萬 session 數據揭秘:AI coding agent 沒有取代專業,它在放大專業 — 2026-06-24- 【深度分析】GLM-5.2:開源模型第一次在 agent 戰場上「感覺對了」 — 2026-06-24- 【深度翻譯】GPT-5 幫免疫學家破解三年未解之謎——但這真的是「理解」嗎? — 2026-06-24- 【深度實作】CoT Forgery:當 LLM 把偽造的思考當成自己的記憶 — 2026-06-23- 【深度分析】Oak——專為 AI agent 設計的版本控制系統,從新思考 Git 的設計假設 — 2026-06-23- 【論文拆解】Prompt Injection 的根源不是漏洞,是角色混淆 — 2026-06-23- 【深度分析】GLM-5.2 開源模型如何突破 agent 能力門檻 — 2026-06-23- 【深度分析】Anthropic 開始要求身分驗證——Claude 使用者準備交證件 — 2026-06-22- 【深度翻譯】Recall — 把 Claude Code 的記憶鎖在本機 — 2026-06-22- 【深度翻譯】Agent 不需要你的帳號:Cloudflare 推出臨時帳號,讓 AI 自己搞定部署 — 2026-06-22- 【深度分析】最保守的行業先跑了——Bayer 的 PRINCE 系統與 production-ready agentic RAG — 2026-06-22- LLM 週報:Shazeer 與 Jumper 換陣營的那一週——AI 人才戰爭進入核彈級 — 2026-06-21- 【深度分析】LLMs are complicated now — 當語言模型走上推薦系統的複雜化之路 — 2026-06-21- 【深度分析】Mistral Small 4:128 專家的統一者,把推理、多模態、編碼塞進一顆模型 — 2026-06-20- 【深度分析】GLM-5.2:中國開源模型攻頂,753B 參數拿下純文字 LLM 第一——但 token 燒很兇 — 2026-06-20- 【深度翻譯】AI 人才大地震:Transformer 之父投 OpenAI,AlphaFold 之父投 Anthropic — 2026-06-20- 【深度分析】搜尋引擎能當記憶嗎?Elasticsearch 上的 agent 長期記憶系統,與 0.89 recall 背後沒說的 11% — 2026-06-19- 【深度分析】DeepSeek V4 沉默上線視覺功能:當中國開源模型不再有功能缺口,矽谷的護城河剩下什麼? — 2026-06-19- 【深度分析】Google 推出 ARD 開放規範:agent 網路的 DNS 時刻,還是新一輪標準殖民? — 2026-06-19- 【深度分析】Qwen-Robot Suite:把機器人 AI 拆成三塊,是通往通用機器人的最短路徑,還是對端到端信仰的背叛? — 2026-06-18- 【深度翻譯】一個機器人朝你衝過來——你希望它跑的是 Claude 還是 Grok? — 2026-06-18- 【深度翻譯】OpenAI 財務文件外洩:$21B 虧損的背後,前沿 AI 是一門什麼樣的生意? — 2026-06-18- 【城武觀點】當政府用「感覺」作為 AI 管制標準:Anthropic 內鬨事件中的四個認識論漏洞 — 2026-06-18- 【日報】2026 年 6 月 17 日 — AI 信任的量化、手機 agent 的蛻變、與荷蘭的主權賭注 — 2026-06-17- 【論文拆解】AI agent 之間的信任不是道德問題,是工程問題——MIT 用一套生存遊戲測出了信任的形成、破裂與恢復 — 2026-06-17- 【論文拆解】PhoneHarness:手機 Agent 評測從「點對下一頁」進化到「任務真的完成了嗎」——以及那失敗的 25% 教我們的事 — 2026-06-17- 【速報】MiniMax M3 開源權重正式釋出:首個同時具備前沿 Coding、1M 上下文、原生多模態的開放模型 — 2026-06-17- 【論文拆解】Metric Match:你用 LLM 來省人類標註,再用 LLM 來驗證 LLM——這條遞歸鏈的終點,是個 rejection sampling — 2026-06-17- 【深度翻譯】GPT-NL:荷蘭用 €13.5M 公共資金打造主權語言模型,跟矽谷的帳單正面對決 — 2026-06-17- 【城武觀點】本地模型能取代 Claude 了嗎?HN 開發者的實戰告白 — 2026-06-16- 【深度分析】歐洲不需要 OpenAI 或 Anthropic:Euromesh 的聯邦算力反擊 — 2026-06-16- 【深度分析】當 AI 實驗室變成宮鬥劇:Anthropic 人事衝突如何癱瘓了全球模型 — 2026-06-16- 【深度翻譯】TCS 與 Anthropic 結盟:五萬名員工當白老鼠,把 Claude 推進銀行、保險、醫療的監管高牆內 — 2026-06-15- 【深度解析】里約市政府的「自研 AI」鬧劇:397B 參數的模型,其實是別人的程式碼拼裝車 — 2026-06-15- 【深度翻譯】Ponytail:教 AI agent 學最懶的資深工程師——最好的程式碼是你沒寫的那一行 — 2026-06-15- 【深度翻譯】HEAL:Google 的醫療 AI 公平性框架——你的模型很準,但對最需要的人夠好嗎? — 2026-06-15- 【深度解析】雲端 LLM 淘金熱的盡頭:Apple 的本地 AI 賭注,與 Fable 5 封鎖令敲響的警鐘 — 2026-06-15- 【深度解析】是 Anthropic 自己求來的:一篇逐條對照 Amodei 政策宣言與政府封殺令的毀滅性評論 — 2026-06-15- LLM 週報:Amazon 一通檢舉電話讓 Anthropic 全球下架——當「安全」變成最好用的武器 — 2026-06-14- 【深度翻譯】消費級雙卡救星:RTX 5080 + 3090 跑 Qwen 3.6 27B Q8,每秒 80+ tokens 實戰配置 — 2026-06-14- 【深度分析】用「全世界最危險的 AI」做了一款牧羊犬遊戲:Claude Fable 5 的創意邊界在哪裡? — 2026-06-14- 【深度分析】當你的投資人打電話給白宮:Amazon 如何觸發 Anthropic 模型的全球封殺令 — 2026-06-14- 【深度翻譯】「你不就直接上傳 ChatGPT 嗎?」——一位翻譯師的 AI 醒悟實錄 — 2026-06-13- 【深度翻譯】Anthropic 的監管產業登陸戰:TCS 與 DXC 雙線出擊 — 2026-06-13- 【深度翻譯】Chris Olah 在梵蒂岡的告白:我們甚至不完全理解自己創造的東西 — 2026-06-13- 【深度翻譯】FablePool:當眾人集資買一個 Prompt,AI 的群眾募資時代來了 — 2026-06-13- 【深度分析】ThePrimeagen 的憤怒:「我覺得 Anthropic 在騙你」——Coding 真的被「解決」了嗎? — 2026-06-13- 【深度翻譯】AI Agent 掃描 DN42 搞到操作者破產:一場價值 $6,531 的常識課 — 2026-06-13- 【深度分析】Anthropic 公開百萬筆 agent 行為數據——人類正在把愈來愈多決定權交給 AI,但真的知道交了多少嗎? — 2026-06-11- 【論文拆解】把神經網路刻進 FPGA,推論 + 訓練不到一微秒——KAN 架構正在重新定義「即時」的意義 — 2026-06-11- 【深度翻譯】Google 用 Gemini 做了整場 I/O——這算「AI 真的有用」還是「我們產品很多」? — 2026-06-11- 【深度翻譯】Fable 5 的安全限制讓資安研究社群炸鍋——善意 guardrails 為什麼反而製造更多問題? — 2026-06-11- 【深度翻譯】Chris Olah 在梵蒂岡談 AI——懺悔的姿態,還是正當性的轉移? — 2026-06-11- 【深度分析】0.01 歐元就能劫持銀行 AI 助手——間接提示注入為什麼是金融業的定時炸彈? — 2026-06-11- 【論文拆解】LLM 推論失敗的 Token 級指紋:模型不是亂錯,是「頑固地錯」——而且有跡可循 — 2026-06-10- 【論文拆解】LLM 個人化的「合成資料陷阱」:模型以為自己很懂你,但人類說「並沒有」 — 2026-06-10- 【深度分析】GPT-Rosalind:OpenAI 的「生命科學專家」是真正的突破,還是精美的比較表魔術? — 2026-06-10- 【深度分析】Claude Opus 4.8:小版本迭代的飽和困境,與藏在背後的 Mythos 暗號 — 2026-06-10- 【深度分析】ChatGPT Dreaming:當你的 AI 開始在你睡覺時「做夢」整理記憶——貼心還是恐怖? — 2026-06-10- 【論文拆解】Agent Harness 重塑代理搜尋:grep 居然比向量檢索更準?我們對 RAG 的理解可能需要重來 — 2026-06-10- 【深度實作】grep 真的打贏向量搜尋——我們寫了一個 benchmark,跑了 20 題,結果跟論文說的一樣 — 2026-06-10- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任,還是先射箭再畫靶? — 2026-06-09- 【深度翻譯】「LLM 正把我的職涯變成一場笑話」——續集:作者回應酸民、質疑者、還有樂觀主義者 — 2026-06-09- 【深度翻譯】Apple 的新 AI 架構,心臟是 Google Gemini——這對兩家公司、開發者、還有你的隱私,代表什麼? — 2026-06-09- 【日報】2026 年 6 月 8 日 — DeepSeek 超車 GPT-5.5、LLM 推理失敗解剖、與 AI 掠奪價值的 HN 大論戰 — 2026-06-08- 【論文拆解】Web Agent 每做一步就重讀整頁 DOM?這設計從根本上就錯了——Signal-Driven Observation 提案全解析 — 2026-06-08- 【論文拆解】LLM 的輸出太「安全」了——UnpredictaBench 證明它們根本不懂什麼叫隨機 — 2026-06-08- 【論文拆解】LLM 推理失敗的兩種死法:鎖死型 vs 迷航型——從 token 層級解剖 AI 的思考錯誤 — 2026-06-08- 【論文拆解】LLM 個人化研究忘了把「人」放回去——當你的評分老師跟學生用同一本參考書 — 2026-06-08- 【城武觀點】HN 熱議:我們真的要放任 LLM 公司拿走所有人類價值嗎? — 2026-06-08- 【深度翻譯】我用 Claude 設計的次數已經超過 Figma——一個 Jane Street 設計師的告白 — 2026-06-08- 【深度分析】DeepSeek V4 Pro 精確度超越 GPT-5.5 Pro——但 benchmark 數字能當飯吃嗎? — 2026-06-08- 【論文拆解】你的 AI 安全測試根本沒認真攻——攻擊者學會選時機,防禦就廢了一半 — 2026-06-08- 【LLM 日報】2026 年 06 月 08 日 — 16 個 Claude 聯手寫出 C 編譯器、Token 去哪了、與設計師的 Figma 失寵記 — 2026-06-08- 【全文翻譯】Anthropic/OpenAI 每收你 $100,背後可能燒掉 $1000——LLM 編碼經濟學的真相 — 2026-06-07- 【深度翻譯】LLM 正在侵蝕我的軟體工程職涯,而我不知道該怎麼辦 — 2026-06-07- 【LLM 日報】2026 年 06 月 07 日 — Claude Opus 4.8 降臨、AI 寫 Code 的千倍帳單、與 LLM 侵蝕工程師職涯 — 2026-06-07## archive

11 篇文章- 【未解之謎】太平洋深海傳來規律訊號——是沈睡的古文明還是外星基地? — 2026-06-07- 【未解之謎】巨石陣驚現幽浮?監視器畫面外流! — 2026-04-08- 【極度異常】毫無陰氣的8秒溫馨毛球監視紀錄 — 2026-03-29- 露營驚見大腳怪!樹上攝影機清晰拍下龐大身軀 — 2026-03-29- 【絕密空拍】巨大麥田圈現蹤,這絕對不是人類能踩出來的… — 2026-03-29- 【未解謎團】露營驚見神秘巨獸…這是大腳怪嗎? — 2026-03-29- 街頭神秘料理吃下直接消失?跨次元升天的真實錄像 — 2026-03-28- 我們身邊的古老監視器?狗狗真實身分解密 — 2026-03-28- 未解檔案:02號片段 — 2026-03-27- 儀式檔案:消失的蹤跡 — 2026-03-27- 本部落格 AI 輔助宣告 — 2026-03-27## chengwu-opinion

4 篇文章- 【城武觀點】peerd — 瀏覽器就是最好的 AI agent runtime?這個賭注比你想像的更大 — 2026-06-25- 【城武觀點】當政府用「感覺」作為 AI 管制標準:Anthropic 內鬨事件中的四個認識論漏洞 — 2026-06-18- 【城武觀點】本地模型能取代 Claude 了嗎?HN 開發者的實戰告白 — 2026-06-16- 【城武觀點】HN 熱議:我們真的要放任 LLM 公司拿走所有人類價值嗎? — 2026-06-08## culture

1 篇文章- 【深度翻譯】你想要我的注意力,但你連自己都沒讀過這篇?——一篇 AI 時代的協作禮儀宣言 — 2026-06-12## daily

26 篇文章- 【LLM 日報】2026 年 06 月 29 日 — 開源 GLM 5.2 裸跑資安 benchmark 擊敗 Claude Code — 2026-06-29- 【LLM 日報】2026 年 06 月 28 日 — OpenAI 出新模型,但鑰匙先交給美國政府 — 2026-06-28- 【LLM 日報】2026 年 06 月 27 日 — 華盛頓開始發放 AI 入場券 — 2026-06-27- 【LLM 日報】2026 年 6 月 26 日 — 政府叫停、IPO 延後、Slack 裡多了一個同事 — 2026-06-26- 【LLM 日報】2026 年 6 月 25 日 — 自己的晶片自己造,自己的權力自己找 — 2026-06-25- 【LLM 日報】2026 年 6 月 24 日 — agent 的訓練場蓋好了,但 agent 是什麼還沒人說清楚 — 2026-06-24- 【LLM 日報】2026 年 6 月 23 日 — Claude 開始驗證你的身分,瑞士推出全開源主權 AI 模型 — 2026-06-23- 【LLM 日報】2026 年 6 月 22 日 — AI agent 終於可以自己部署了,拜耳把 RAG 做成製藥業的 Google — 2026-06-22- 【LLM 日報】2026 年 6 月 21 日 — John Jumper 加入 Anthropic,ITNet 一篇論文統一三大神經架構 — 2026-06-21- 【LLM 日報】2026 年 6 月 20 日 — Noam Shazeer 投奔 OpenAI,Anthropic 說會寫 code 的不一定是工程師 — 2026-06-20- 【LLM 日報】2026 年 6 月 19 日 — 一個病毒 prompt,撕開 ChatGPT 圖片過濾的遮羞布 — 2026-06-19- 【LLM 日報】2026 年 6 月 18 日 — Qwen 一次丟出三顆機器人大腦,AI 正式走出聊天室 — 2026-06-18- 【日報】2026 年 6 月 17 日 — AI 信任的量化、手機 agent 的蛻變、與荷蘭的主權賭注 — 2026-06-17- 【LLM 日報】2026 年 06 月 17 日 — 1206 個工程師在問同一件事:本地模型能上生產了嗎? — 2026-06-17- 【LLM 日報】2026 年 06 月 16 日 — 里約的「自產」397B 模型,拆開來是 60% Nex + 40% Qwen — 2026-06-16- 【LLM 日報】2026 年 06 月 15 日 —「安全敘事的迴力鏢」:Anthropic 求政府監管,政府監管了 Anthropic — 2026-06-15- 【LLM 日報】2026 年 06 月 14 日 — OpenAI 買下 Ona 要讓 Codex 在你關機後繼續幹活、Anthropic 問了五萬美國人:只有 15% 信任 AI 公司 — 2026-06-14- 【LLM 日報】2026 年 06 月 13 日 — 一個 AI agent、五台 AWS 高規格主機、$6,531 帳單:DN42 掃描行動的 24 小時災難實錄 — 2026-06-13- 【LLM 日報】2026 年 06 月 12 日 — AI agent 在 Fedora 臥底兩個月,發 PR、關 bug、還說服維護者合併問題程式碼 — 2026-06-12- 【LLM 日報】2026 年 06 月 11 日 — 24 則新聞全收錄,六篇深度分析 — 2026-06-11- 【日報】2026 年 6 月 10 日 — Anthropic 連發 Opus 4.8 + Mythos 預告,OpenAI 推 Dreaming 與 Rosalind,三篇論文揭 LLM 的失敗模式與個人化幻覺 — 2026-06-10- 【LLM 日報】2026 年 06 月 10 日 — Claude Mythos 5 來了:Anthropic 把核彈鎖在保險箱裡,然後把保險箱的鑰匙也吞了 — 2026-06-10- 【LLM 日報】2026 年 06 月 09 日 — 把視覺模型的大腦拆開來看、Coding Agent 的說明書到底有沒有用? — 2026-06-09- 【日報】2026 年 6 月 8 日 — DeepSeek 超車 GPT-5.5、LLM 推理失敗解剖、與 AI 掠奪價值的 HN 大論戰 — 2026-06-08- 【LLM 日報】2026 年 06 月 08 日 — 16 個 Claude 聯手寫出 C 編譯器、Token 去哪了、與設計師的 Figma 失寵記 — 2026-06-08- 【LLM 日報】2026 年 06 月 07 日 — Claude Opus 4.8 降臨、AI 寫 Code 的千倍帳單、與 LLM 侵蝕工程師職涯 — 2026-06-07## deep-analysis

29 篇文章- 【深度分析】他用 Claude Code 分析自己的 MRI——AI 說你沒撕裂,醫生說你有,你信誰? — 2026-06-29- 【深度分析】AI agent 正在吃掉白領工作——OpenAI 內部數據告訴你這件事的規模有多大 — 2026-06-28- 【深度分析】Workweave Router——插入 Claude Code/Codex/Cursor 中間層的智慧路由,省 40-70% 成本的代價是什麼? — 2026-06-27- 【深度分析】開源 LLM 何時追上閉源?聖誕節 vs. 永遠差五個月——一個 benchmark 的兩種人生 — 2026-06-27- 【深度分析】GPT-5.6 Sol 正式預覽——三層模型、四層安全、政府把關,OpenAI 說「我們相信廣泛存取」 — 2026-06-27- 【深度分析】六大 AI 模型政治光譜大解析——ChatGPT 最左、Grok 最右、Gemini 的中立是演算法還是自我審查? — 2026-06-26- 【深度分析】Reid Hoffman 批 xAI「火車事故」、SpaceX「不是 AI 公司」——但真正的新聞不在他說了什麼,在誰在說、為什麼現在說 — 2026-06-25- 【深度分析】Google 把 computer use 塞進模型本體——Gemini 3.5 Flash 的整合路線意味著什麼 — 2026-06-25- 【深度分析】安全公司的雙面困境:Anthropic 告阿里偷模型,卻被自己政府斷 Mythos — 2026-06-25- 【深度分析】Anthropic 40 萬 session 數據揭秘:AI coding agent 沒有取代專業,它在放大專業 — 2026-06-24- 【深度分析】GLM-5.2:開源模型第一次在 agent 戰場上「感覺對了」 — 2026-06-24- 【深度分析】Oak——專為 AI agent 設計的版本控制系統,從新思考 Git 的設計假設 — 2026-06-23- 【深度分析】GLM-5.2 開源模型如何突破 agent 能力門檻 — 2026-06-23- 【深度分析】Anthropic 開始要求身分驗證——Claude 使用者準備交證件 — 2026-06-22- 【深度分析】最保守的行業先跑了——Bayer 的 PRINCE 系統與 production-ready agentic RAG — 2026-06-22- 【深度分析】LLMs are complicated now — 當語言模型走上推薦系統的複雜化之路 — 2026-06-21- 【深度分析】Mistral Small 4:128 專家的統一者,把推理、多模態、編碼塞進一顆模型 — 2026-06-20- 【深度分析】GLM-5.2:中國開源模型攻頂,753B 參數拿下純文字 LLM 第一——但 token 燒很兇 — 2026-06-20- 【深度分析】搜尋引擎能當記憶嗎?Elasticsearch 上的 agent 長期記憶系統,與 0.89 recall 背後沒說的 11% — 2026-06-19- 【深度分析】DeepSeek V4 沉默上線視覺功能:當中國開源模型不再有功能缺口,矽谷的護城河剩下什麼? — 2026-06-19- 【深度分析】Google 推出 ARD 開放規範:agent 網路的 DNS 時刻,還是新一輪標準殖民? — 2026-06-19- 【深度分析】Qwen-Robot Suite:把機器人 AI 拆成三塊,是通往通用機器人的最短路徑,還是對端到端信仰的背叛? — 2026-06-18- 【深度分析】歐洲不需要 OpenAI 或 Anthropic:Euromesh 的聯邦算力反擊 — 2026-06-16- 【深度分析】當 AI 實驗室變成宮鬥劇:Anthropic 人事衝突如何癱瘓了全球模型 — 2026-06-16- 【深度分析】用「全世界最危險的 AI」做了一款牧羊犬遊戲:Claude Fable 5 的創意邊界在哪裡? — 2026-06-14- 【深度分析】當你的投資人打電話給白宮:Amazon 如何觸發 Anthropic 模型的全球封殺令 — 2026-06-14- 【深度分析】ThePrimeagen 的憤怒:「我覺得 Anthropic 在騙你」——Coding 真的被「解決」了嗎? — 2026-06-13- 【深度分析】Anthropic 公開百萬筆 agent 行為數據——人類正在把愈來愈多決定權交給 AI,但真的知道交了多少嗎? — 2026-06-11- 【深度分析】0.01 歐元就能劫持銀行 AI 助手——間接提示注入為什麼是金融業的定時炸彈? — 2026-06-11## deep-dive

14 篇文章- 【深度翻譯】Google Research:教 LLM「用圖的語言說話」——圖結構編碼對推理能力的影響有多大? — 2026-06-12- 【深度解析】OpenAI 收購 Ona:Codex 不再只是寫 code 的工具,它正在變成 agent 的作業系統 — 2026-06-12- 【深度翻譯】你想要我的注意力,但你連自己都沒讀過這篇?——一篇 AI 時代的協作禮儀宣言 — 2026-06-12- 【深度翻譯】FablePool:群眾集資一個 prompt,AI 幫你做出來——而且全程公開 — 2026-06-12- 【深度解析】Anthropic 為 Fable 隱形護欄道歉——但「先藏再說」的預設值,比任何一條護欄都可怕 — 2026-06-12- 【深度翻譯】Claw Patrol:第一款為 AI agent 設計的開源防火牆,出自 Deno 生態系 — 2026-06-12- 【深度翻譯】Claude Desktop 每開一次就吞你 1.8GB——而且你只用文字聊天 — 2026-06-12- 【深度翻譯】Anthropic 公開 Claude 跨產品安全容器化架構:三次出事、三種隔離模式、一個核心原則 — 2026-06-12- 【深度翻譯】BBVA 把整間銀行押在 AI 上——10 萬員工、2 萬個自訂 GPT,OpenAI 最大銀行客戶現身 — 2026-06-12- 【深度分析】GPT-Rosalind:OpenAI 的「生命科學專家」是真正的突破,還是精美的比較表魔術? — 2026-06-10- 【深度分析】Claude Opus 4.8:小版本迭代的飽和困境,與藏在背後的 Mythos 暗號 — 2026-06-10- 【深度分析】ChatGPT Dreaming:當你的 AI 開始在你睡覺時「做夢」整理記憶——貼心還是恐怖? — 2026-06-10- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任,還是先射箭再畫靶? — 2026-06-09- 【深度翻譯】我用 Claude 設計的次數已經超過 Figma——一個 Jane Street 設計師的告白 — 2026-06-08## deep-implementation

2 篇文章- 【深度實作】CoT Forgery:當 LLM 把偽造的思考當成自己的記憶 — 2026-06-23- 【深度實作】grep 真的打贏向量搜尋——我們寫了一個 benchmark,跑了 20 題,結果跟論文說的一樣 — 2026-06-10## deep-translation

25 篇文章- 【深度翻譯】政府逐客戶審查 GPT-5.6 + IPO 推遲至 2027——OpenAI 的兩條線在同一條繩索上 — 2026-06-28- 【深度翻譯】川普政府要求 OpenAI 延遲 GPT-5.6——政府直接介入模型釋出,OpenAI 與 Anthropic 的差別待遇 — 2026-06-26- 【深度翻譯】一行 code 都沒寫——用 Claude Code 把 AI 影像修補模型移植到瀏覽器的全程實錄 — 2026-06-24- 【深度翻譯】GPT-5 幫免疫學家破解三年未解之謎——但這真的是「理解」嗎? — 2026-06-24- 【深度翻譯】Recall — 把 Claude Code 的記憶鎖在本機 — 2026-06-22- 【深度翻譯】Agent 不需要你的帳號:Cloudflare 推出臨時帳號,讓 AI 自己搞定部署 — 2026-06-22- 【深度翻譯】AI 人才大地震:Transformer 之父投 OpenAI,AlphaFold 之父投 Anthropic — 2026-06-20- 【深度翻譯】一個機器人朝你衝過來——你希望它跑的是 Claude 還是 Grok? — 2026-06-18- 【深度翻譯】OpenAI 財務文件外洩:$21B 虧損的背後,前沿 AI 是一門什麼樣的生意? — 2026-06-18- 【速報】MiniMax M3 開源權重正式釋出:首個同時具備前沿 Coding、1M 上下文、原生多模態的開放模型 — 2026-06-17- 【深度翻譯】GPT-NL:荷蘭用 €13.5M 公共資金打造主權語言模型,跟矽谷的帳單正面對決 — 2026-06-17- 【深度翻譯】消費級雙卡救星:RTX 5080 + 3090 跑 Qwen 3.6 27B Q8,每秒 80+ tokens 實戰配置 — 2026-06-14- 【深度翻譯】「你不就直接上傳 ChatGPT 嗎?」——一位翻譯師的 AI 醒悟實錄 — 2026-06-13- 【深度翻譯】Anthropic 的監管產業登陸戰:TCS 與 DXC 雙線出擊 — 2026-06-13- 【深度翻譯】Chris Olah 在梵蒂岡的告白:我們甚至不完全理解自己創造的東西 — 2026-06-13- 【深度翻譯】FablePool:當眾人集資買一個 Prompt,AI 的群眾募資時代來了 — 2026-06-13- 【深度翻譯】AI Agent 掃描 DN42 搞到操作者破產:一場價值 $6,531 的常識課 — 2026-06-13- 【深度翻譯】Google 用 Gemini 做了整場 I/O——這算「AI 真的有用」還是「我們產品很多」? — 2026-06-11- 【深度翻譯】Fable 5 的安全限制讓資安研究社群炸鍋——善意 guardrails 為什麼反而製造更多問題? — 2026-06-11- 【深度翻譯】Chris Olah 在梵蒂岡談 AI——懺悔的姿態,還是正當性的轉移? — 2026-06-11- 【深度翻譯】「LLM 正把我的職涯變成一場笑話」——續集:作者回應酸民、質疑者、還有樂觀主義者 — 2026-06-09- 【深度翻譯】Apple 的新 AI 架構,心臟是 Google Gemini——這對兩家公司、開發者、還有你的隱私,代表什麼? — 2026-06-09- 【深度分析】DeepSeek V4 Pro 精確度超越 GPT-5.5 Pro——但 benchmark 數字能當飯吃嗎? — 2026-06-08- 【全文翻譯】Anthropic/OpenAI 每收你 $100,背後可能燒掉 $1000——LLM 編碼經濟學的真相 — 2026-06-07- 【深度翻譯】LLM 正在侵蝕我的軟體工程職涯,而我不知道該怎麼辦 — 2026-06-07## design

1 篇文章- 【深度翻譯】我用 Claude 設計的次數已經超過 Figma——一個 Jane Street 設計師的告白 — 2026-06-08## economy

1 篇文章- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任,還是先射箭再畫靶? — 2026-06-09## engineering

1 篇文章- 【深度翻譯】Anthropic 公開 Claude 跨產品安全容器化架構:三次出事、三種隔離模式、一個核心原則 — 2026-06-12## enterprise

2 篇文章- 【深度解析】OpenAI 收購 Ona:Codex 不再只是寫 code 的工具,它正在變成 agent 的作業系統 — 2026-06-12- 【深度翻譯】BBVA 把整間銀行押在 AI 上——10 萬員工、2 萬個自訂 GPT,OpenAI 最大銀行客戶現身 — 2026-06-12## llm

125 篇文章- 【深度分析】他用 Claude Code 分析自己的 MRI——AI 說你沒撕裂,醫生說你有,你信誰? — 2026-06-29- 【LLM 日報】2026 年 06 月 29 日 — 開源 GLM 5.2 裸跑資安 benchmark 擊敗 Claude Code — 2026-06-29- LLM 週報:華盛頓開始發 AI 入場券——而你不在名單上 — 2026-06-28- 【論文拆解】DSpark——DeepSeek 的半自迴歸推測解碼,如何在重載下加速 60-85% — 2026-06-28- 【深度分析】AI agent 正在吃掉白領工作——OpenAI 內部數據告訴你這件事的規模有多大 — 2026-06-28- 【深度翻譯】政府逐客戶審查 GPT-5.6 + IPO 推遲至 2027——OpenAI 的兩條線在同一條繩索上 — 2026-06-28- 【LLM 日報】2026 年 06 月 28 日 — OpenAI 出新模型,但鑰匙先交給美國政府 — 2026-06-28- 【深度分析】Workweave Router——插入 Claude Code/Codex/Cursor 中間層的智慧路由,省 40-70% 成本的代價是什麼? — 2026-06-27- 【深度分析】開源 LLM 何時追上閉源?聖誕節 vs. 永遠差五個月——一個 benchmark 的兩種人生 — 2026-06-27- 【深度分析】GPT-5.6 Sol 正式預覽——三層模型、四層安全、政府把關,OpenAI 說「我們相信廣泛存取」 — 2026-06-27- 【LLM 日報】2026 年 06 月 27 日 — 華盛頓開始發放 AI 入場券 — 2026-06-27- 【深度分析】六大 AI 模型政治光譜大解析——ChatGPT 最左、Grok 最右、Gemini 的中立是演算法還是自我審查? — 2026-06-26- 【深度翻譯】川普政府要求 OpenAI 延遲 GPT-5.6——政府直接介入模型釋出,OpenAI 與 Anthropic 的差別待遇 — 2026-06-26- 【LLM 日報】2026 年 6 月 26 日 — 政府叫停、IPO 延後、Slack 裡多了一個同事 — 2026-06-26- 【城武觀點】peerd — 瀏覽器就是最好的 AI agent runtime?這個賭注比你想像的更大 — 2026-06-25- 【深度分析】Reid Hoffman 批 xAI「火車事故」、SpaceX「不是 AI 公司」——但真正的新聞不在他說了什麼,在誰在說、為什麼現在說 — 2026-06-25- 【論文拆解】模擬環境訓練比真實環境更強?Qwen-AgentWorld 的反直覺答案 — 2026-06-25- 【深度分析】Google 把 computer use 塞進模型本體——Gemini 3.5 Flash 的整合路線意味著什麼 — 2026-06-25- 【深度分析】安全公司的雙面困境:Anthropic 告阿里偷模型,卻被自己政府斷 Mythos — 2026-06-25- 【LLM 日報】2026 年 6 月 25 日 — 自己的晶片自己造,自己的權力自己找 — 2026-06-25- 【深度翻譯】一行 code 都沒寫——用 Claude Code 把 AI 影像修補模型移植到瀏覽器的全程實錄 — 2026-06-24- 【深度分析】Anthropic 40 萬 session 數據揭秘:AI coding agent 沒有取代專業,它在放大專業 — 2026-06-24- 【深度分析】GLM-5.2:開源模型第一次在 agent 戰場上「感覺對了」 — 2026-06-24- 【深度翻譯】GPT-5 幫免疫學家破解三年未解之謎——但這真的是「理解」嗎? — 2026-06-24- 【LLM 日報】2026 年 6 月 24 日 — agent 的訓練場蓋好了,但 agent 是什麼還沒人說清楚 — 2026-06-24- 【深度實作】CoT Forgery:當 LLM 把偽造的思考當成自己的記憶 — 2026-06-23- 【深度分析】Oak——專為 AI agent 設計的版本控制系統,從新思考 Git 的設計假設 — 2026-06-23- 【論文拆解】Prompt Injection 的根源不是漏洞,是角色混淆 — 2026-06-23- 【深度分析】GLM-5.2 開源模型如何突破 agent 能力門檻 — 2026-06-23- 【LLM 日報】2026 年 6 月 23 日 — Claude 開始驗證你的身分,瑞士推出全開源主權 AI 模型 — 2026-06-23- 【深度分析】Anthropic 開始要求身分驗證——Claude 使用者準備交證件 — 2026-06-22- 【深度翻譯】Recall — 把 Claude Code 的記憶鎖在本機 — 2026-06-22- 【深度翻譯】Agent 不需要你的帳號:Cloudflare 推出臨時帳號,讓 AI 自己搞定部署 — 2026-06-22- 【深度分析】最保守的行業先跑了——Bayer 的 PRINCE 系統與 production-ready agentic RAG — 2026-06-22- 【LLM 日報】2026 年 6 月 22 日 — AI agent 終於可以自己部署了,拜耳把 RAG 做成製藥業的 Google — 2026-06-22- LLM 週報:Shazeer 與 Jumper 換陣營的那一週——AI 人才戰爭進入核彈級 — 2026-06-21- 【深度分析】LLMs are complicated now — 當語言模型走上推薦系統的複雜化之路 — 2026-06-21- 【LLM 日報】2026 年 6 月 21 日 — John Jumper 加入 Anthropic,ITNet 一篇論文統一三大神經架構 — 2026-06-21- 【深度分析】Mistral Small 4:128 專家的統一者,把推理、多模態、編碼塞進一顆模型 — 2026-06-20- 【深度分析】GLM-5.2:中國開源模型攻頂,753B 參數拿下純文字 LLM 第一——但 token 燒很兇 — 2026-06-20- 【深度翻譯】AI 人才大地震:Transformer 之父投 OpenAI,AlphaFold 之父投 Anthropic — 2026-06-20- 【LLM 日報】2026 年 6 月 20 日 — Noam Shazeer 投奔 OpenAI,Anthropic 說會寫 code 的不一定是工程師 — 2026-06-20- 【深度分析】搜尋引擎能當記憶嗎?Elasticsearch 上的 agent 長期記憶系統,與 0.89 recall 背後沒說的 11% — 2026-06-19- 【深度分析】DeepSeek V4 沉默上線視覺功能:當中國開源模型不再有功能缺口,矽谷的護城河剩下什麼? — 2026-06-19- 【深度分析】Google 推出 ARD 開放規範:agent 網路的 DNS 時刻,還是新一輪標準殖民? — 2026-06-19- 【LLM 日報】2026 年 6 月 19 日 — 一個病毒 prompt,撕開 ChatGPT 圖片過濾的遮羞布 — 2026-06-19- 【深度分析】Qwen-Robot Suite:把機器人 AI 拆成三塊,是通往通用機器人的最短路徑,還是對端到端信仰的背叛? — 2026-06-18- 【深度翻譯】一個機器人朝你衝過來——你希望它跑的是 Claude 還是 Grok? — 2026-06-18- 【深度翻譯】OpenAI 財務文件外洩:$21B 虧損的背後,前沿 AI 是一門什麼樣的生意? — 2026-06-18- 【城武觀點】當政府用「感覺」作為 AI 管制標準:Anthropic 內鬨事件中的四個認識論漏洞 — 2026-06-18- 【LLM 日報】2026 年 6 月 18 日 — Qwen 一次丟出三顆機器人大腦,AI 正式走出聊天室 — 2026-06-18- 【日報】2026 年 6 月 17 日 — AI 信任的量化、手機 agent 的蛻變、與荷蘭的主權賭注 — 2026-06-17- 【論文拆解】AI agent 之間的信任不是道德問題,是工程問題——MIT 用一套生存遊戲測出了信任的形成、破裂與恢復 — 2026-06-17- 【論文拆解】PhoneHarness:手機 Agent 評測從「點對下一頁」進化到「任務真的完成了嗎」——以及那失敗的 25% 教我們的事 — 2026-06-17- 【速報】MiniMax M3 開源權重正式釋出:首個同時具備前沿 Coding、1M 上下文、原生多模態的開放模型 — 2026-06-17- 【論文拆解】Metric Match:你用 LLM 來省人類標註,再用 LLM 來驗證 LLM——這條遞歸鏈的終點,是個 rejection sampling — 2026-06-17- 【深度翻譯】GPT-NL:荷蘭用 €13.5M 公共資金打造主權語言模型,跟矽谷的帳單正面對決 — 2026-06-17- 【LLM 日報】2026 年 06 月 17 日 — 1206 個工程師在問同一件事:本地模型能上生產了嗎? — 2026-06-17- 【城武觀點】本地模型能取代 Claude 了嗎?HN 開發者的實戰告白 — 2026-06-16- 【深度分析】歐洲不需要 OpenAI 或 Anthropic:Euromesh 的聯邦算力反擊 — 2026-06-16- 【深度分析】當 AI 實驗室變成宮鬥劇:Anthropic 人事衝突如何癱瘓了全球模型 — 2026-06-16- 【LLM 日報】2026 年 06 月 16 日 — 里約的「自產」397B 模型,拆開來是 60% Nex + 40% Qwen — 2026-06-16- 【深度翻譯】TCS 與 Anthropic 結盟:五萬名員工當白老鼠,把 Claude 推進銀行、保險、醫療的監管高牆內 — 2026-06-15- 【深度解析】里約市政府的「自研 AI」鬧劇:397B 參數的模型,其實是別人的程式碼拼裝車 — 2026-06-15- 【深度翻譯】Ponytail:教 AI agent 學最懶的資深工程師——最好的程式碼是你沒寫的那一行 — 2026-06-15- 【深度翻譯】HEAL:Google 的醫療 AI 公平性框架——你的模型很準,但對最需要的人夠好嗎? — 2026-06-15- 【深度解析】雲端 LLM 淘金熱的盡頭:Apple 的本地 AI 賭注,與 Fable 5 封鎖令敲響的警鐘 — 2026-06-15- 【深度解析】是 Anthropic 自己求來的:一篇逐條對照 Amodei 政策宣言與政府封殺令的毀滅性評論 — 2026-06-15- 【LLM 日報】2026 年 06 月 15 日 —「安全敘事的迴力鏢」:Anthropic 求政府監管,政府監管了 Anthropic — 2026-06-15- LLM 週報:Amazon 一通檢舉電話讓 Anthropic 全球下架——當「安全」變成最好用的武器 — 2026-06-14- 【深度翻譯】消費級雙卡救星:RTX 5080 + 3090 跑 Qwen 3.6 27B Q8,每秒 80+ tokens 實戰配置 — 2026-06-14- 【深度分析】用「全世界最危險的 AI」做了一款牧羊犬遊戲:Claude Fable 5 的創意邊界在哪裡? — 2026-06-14- 【深度分析】當你的投資人打電話給白宮:Amazon 如何觸發 Anthropic 模型的全球封殺令 — 2026-06-14- 【LLM 日報】2026 年 06 月 14 日 — OpenAI 買下 Ona 要讓 Codex 在你關機後繼續幹活、Anthropic 問了五萬美國人:只有 15% 信任 AI 公司 — 2026-06-14- 【LLM 週報】2026 年 06 月 13 日 — Anthropic 的魔幻一天:一邊說 coding 已死、一邊把 Claude 塞進銀行 — 2026-06-13- 【深度翻譯】「你不就直接上傳 ChatGPT 嗎?」——一位翻譯師的 AI 醒悟實錄 — 2026-06-13- 【深度翻譯】Anthropic 的監管產業登陸戰:TCS 與 DXC 雙線出擊 — 2026-06-13- 【深度翻譯】Chris Olah 在梵蒂岡的告白:我們甚至不完全理解自己創造的東西 — 2026-06-13- 【深度翻譯】FablePool:當眾人集資買一個 Prompt,AI 的群眾募資時代來了 — 2026-06-13- 【深度分析】ThePrimeagen 的憤怒:「我覺得 Anthropic 在騙你」——Coding 真的被「解決」了嗎? — 2026-06-13- 【深度翻譯】AI Agent 掃描 DN42 搞到操作者破產:一場價值 $6,531 的常識課 — 2026-06-13- 【LLM 日報】2026 年 06 月 13 日 — 一個 AI agent、五台 AWS 高規格主機、$6,531 帳單:DN42 掃描行動的 24 小時災難實錄 — 2026-06-13- 【深度翻譯】Google Research:教 LLM「用圖的語言說話」——圖結構編碼對推理能力的影響有多大? — 2026-06-12- 【深度解析】OpenAI 收購 Ona:Codex 不再只是寫 code 的工具,它正在變成 agent 的作業系統 — 2026-06-12- 【深度翻譯】你想要我的注意力,但你連自己都沒讀過這篇?——一篇 AI 時代的協作禮儀宣言 — 2026-06-12- 【深度翻譯】FablePool:群眾集資一個 prompt,AI 幫你做出來——而且全程公開 — 2026-06-12- 【深度解析】Anthropic 為 Fable 隱形護欄道歉——但「先藏再說」的預設值,比任何一條護欄都可怕 — 2026-06-12- 【深度翻譯】Claw Patrol:第一款為 AI agent 設計的開源防火牆,出自 Deno 生態系 — 2026-06-12- 【深度翻譯】Claude Desktop 每開一次就吞你 1.8GB——而且你只用文字聊天 — 2026-06-12- 【深度翻譯】Anthropic 公開 Claude 跨產品安全容器化架構:三次出事、三種隔離模式、一個核心原則 — 2026-06-12- 【深度翻譯】BBVA 把整間銀行押在 AI 上——10 萬員工、2 萬個自訂 GPT,OpenAI 最大銀行客戶現身 — 2026-06-12- 【LLM 日報】2026 年 06 月 12 日 — AI agent 在 Fedora 臥底兩個月,發 PR、關 bug、還說服維護者合併問題程式碼 — 2026-06-12- 【深度分析】Anthropic 公開百萬筆 agent 行為數據——人類正在把愈來愈多決定權交給 AI,但真的知道交了多少嗎? — 2026-06-11- 【論文拆解】把神經網路刻進 FPGA,推論 + 訓練不到一微秒——KAN 架構正在重新定義「即時」的意義 — 2026-06-11- 【深度翻譯】Google 用 Gemini 做了整場 I/O——這算「AI 真的有用」還是「我們產品很多」? — 2026-06-11- 【深度翻譯】Fable 5 的安全限制讓資安研究社群炸鍋——善意 guardrails 為什麼反而製造更多問題? — 2026-06-11- 【深度翻譯】Chris Olah 在梵蒂岡談 AI——懺悔的姿態,還是正當性的轉移? — 2026-06-11- 【深度分析】0.01 歐元就能劫持銀行 AI 助手——間接提示注入為什麼是金融業的定時炸彈? — 2026-06-11- 【LLM 日報】2026 年 06 月 11 日 — 24 則新聞全收錄,六篇深度分析 — 2026-06-11- 【日報】2026 年 6 月 10 日 — Anthropic 連發 Opus 4.8 + Mythos 預告,OpenAI 推 Dreaming 與 Rosalind,三篇論文揭 LLM 的失敗模式與個人化幻覺 — 2026-06-10- 【論文拆解】LLM 推論失敗的 Token 級指紋:模型不是亂錯,是「頑固地錯」——而且有跡可循 — 2026-06-10- 【論文拆解】LLM 個人化的「合成資料陷阱」:模型以為自己很懂你,但人類說「並沒有」 — 2026-06-10- 【深度分析】GPT-Rosalind:OpenAI 的「生命科學專家」是真正的突破,還是精美的比較表魔術? — 2026-06-10- 【深度分析】Claude Opus 4.8:小版本迭代的飽和困境,與藏在背後的 Mythos 暗號 — 2026-06-10- 【深度分析】ChatGPT Dreaming:當你的 AI 開始在你睡覺時「做夢」整理記憶——貼心還是恐怖? — 2026-06-10- 【論文拆解】Agent Harness 重塑代理搜尋:grep 居然比向量檢索更準?我們對 RAG 的理解可能需要重來 — 2026-06-10- 【深度實作】grep 真的打贏向量搜尋——我們寫了一個 benchmark,跑了 20 題,結果跟論文說的一樣 — 2026-06-10- 【LLM 日報】2026 年 06 月 10 日 — Claude Mythos 5 來了:Anthropic 把核彈鎖在保險箱裡,然後把保險箱的鑰匙也吞了 — 2026-06-10- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任,還是先射箭再畫靶? — 2026-06-09- 【深度翻譯】「LLM 正把我的職涯變成一場笑話」——續集:作者回應酸民、質疑者、還有樂觀主義者 — 2026-06-09- 【深度翻譯】Apple 的新 AI 架構,心臟是 Google Gemini——這對兩家公司、開發者、還有你的隱私,代表什麼? — 2026-06-09- 【LLM 日報】2026 年 06 月 09 日 — 把視覺模型的大腦拆開來看、Coding Agent 的說明書到底有沒有用? — 2026-06-09- 【日報】2026 年 6 月 8 日 — DeepSeek 超車 GPT-5.5、LLM 推理失敗解剖、與 AI 掠奪價值的 HN 大論戰 — 2026-06-08- 【論文拆解】Web Agent 每做一步就重讀整頁 DOM?這設計從根本上就錯了——Signal-Driven Observation 提案全解析 — 2026-06-08- 【論文拆解】LLM 的輸出太「安全」了——UnpredictaBench 證明它們根本不懂什麼叫隨機 — 2026-06-08- 【論文拆解】LLM 推理失敗的兩種死法:鎖死型 vs 迷航型——從 token 層級解剖 AI 的思考錯誤 — 2026-06-08- 【論文拆解】LLM 個人化研究忘了把「人」放回去——當你的評分老師跟學生用同一本參考書 — 2026-06-08- 【城武觀點】HN 熱議:我們真的要放任 LLM 公司拿走所有人類價值嗎? — 2026-06-08- 【深度翻譯】我用 Claude 設計的次數已經超過 Figma——一個 Jane Street 設計師的告白 — 2026-06-08- 【深度分析】DeepSeek V4 Pro 精確度超越 GPT-5.5 Pro——但 benchmark 數字能當飯吃嗎? — 2026-06-08- 【論文拆解】你的 AI 安全測試根本沒認真攻——攻擊者學會選時機,防禦就廢了一半 — 2026-06-08- 【LLM 日報】2026 年 06 月 08 日 — 16 個 Claude 聯手寫出 C 編譯器、Token 去哪了、與設計師的 Figma 失寵記 — 2026-06-08- 【全文翻譯】Anthropic/OpenAI 每收你 $100,背後可能燒掉 $1000——LLM 編碼經濟學的真相 — 2026-06-07- 【深度翻譯】LLM 正在侵蝕我的軟體工程職涯,而我不知道該怎麼辦 — 2026-06-07- 【LLM 日報】2026 年 06 月 07 日 — Claude Opus 4.8 降臨、AI 寫 Code 的千倍帳單、與 LLM 侵蝕工程師職涯 — 2026-06-07## openai

1 篇文章- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任,還是先射箭再畫靶? — 2026-06-09## paper-breakdown

15 篇文章- 【論文拆解】DSpark——DeepSeek 的半自迴歸推測解碼,如何在重載下加速 60-85% — 2026-06-28- 【論文拆解】模擬環境訓練比真實環境更強?Qwen-AgentWorld 的反直覺答案 — 2026-06-25- 【論文拆解】Prompt Injection 的根源不是漏洞,是角色混淆 — 2026-06-23- 【論文拆解】AI agent 之間的信任不是道德問題,是工程問題——MIT 用一套生存遊戲測出了信任的形成、破裂與恢復 — 2026-06-17- 【論文拆解】PhoneHarness:手機 Agent 評測從「點對下一頁」進化到「任務真的完成了嗎」——以及那失敗的 25% 教我們的事 — 2026-06-17- 【論文拆解】Metric Match:你用 LLM 來省人類標註,再用 LLM 來驗證 LLM——這條遞歸鏈的終點,是個 rejection sampling — 2026-06-17- 【論文拆解】把神經網路刻進 FPGA,推論 + 訓練不到一微秒——KAN 架構正在重新定義「即時」的意義 — 2026-06-11- 【論文拆解】LLM 推論失敗的 Token 級指紋:模型不是亂錯,是「頑固地錯」——而且有跡可循 — 2026-06-10- 【論文拆解】LLM 個人化的「合成資料陷阱」:模型以為自己很懂你,但人類說「並沒有」 — 2026-06-10- 【論文拆解】Agent Harness 重塑代理搜尋:grep 居然比向量檢索更準?我們對 RAG 的理解可能需要重來 — 2026-06-10- 【論文拆解】Web Agent 每做一步就重讀整頁 DOM?這設計從根本上就錯了——Signal-Driven Observation 提案全解析 — 2026-06-08- 【論文拆解】LLM 的輸出太「安全」了——UnpredictaBench 證明它們根本不懂什麼叫隨機 — 2026-06-08- 【論文拆解】LLM 推理失敗的兩種死法:鎖死型 vs 迷航型——從 token 層級解剖 AI 的思考錯誤 — 2026-06-08- 【論文拆解】LLM 個人化研究忘了把「人」放回去——當你的評分老師跟學生用同一本參考書 — 2026-06-08- 【論文拆解】你的 AI 安全測試根本沒認真攻——攻擊者學會選時機,防禦就廢了一半 — 2026-06-08## paranormal

11 篇文章- 【未解之謎】太平洋深海傳來規律訊號——是沈睡的古文明還是外星基地? — 2026-06-07- 【未解之謎】巨石陣驚現幽浮?監視器畫面外流! — 2026-04-08- 【極度異常】毫無陰氣的8秒溫馨毛球監視紀錄 — 2026-03-29- 露營驚見大腳怪!樹上攝影機清晰拍下龐大身軀 — 2026-03-29- 【絕密空拍】巨大麥田圈現蹤,這絕對不是人類能踩出來的… — 2026-03-29- 【未解謎團】露營驚見神秘巨獸…這是大腳怪嗎? — 2026-03-29- 街頭神秘料理吃下直接消失?跨次元升天的真實錄像 — 2026-03-28- 我們身邊的古老監視器?狗狗真實身分解密 — 2026-03-28- 未解檔案:02號片段 — 2026-03-27- 儀式檔案:消失的蹤跡 — 2026-03-27- 本部落格 AI 輔助宣告 — 2026-03-27## research

3 篇文章- 【深度翻譯】HEAL:Google 的醫療 AI 公平性框架——你的模型很準,但對最需要的人夠好嗎? — 2026-06-15- 【深度翻譯】Google Research:教 LLM「用圖的語言說話」——圖結構編碼對推理能力的影響有多大? — 2026-06-12- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任,還是先射箭再畫靶? — 2026-06-09## safety

1 篇文章- 【深度解析】Anthropic 為 Fable 隱形護欄道歉——但「先藏再說」的預設值,比任何一條護欄都可怕 — 2026-06-12## security

2 篇文章- 【深度翻譯】Claw Patrol:第一款為 AI agent 設計的開源防火牆,出自 Deno 生態系 — 2026-06-12- 【深度翻譯】Anthropic 公開 Claude 跨產品安全容器化架構:三次出事、三種隔離模式、一個核心原則 — 2026-06-12## tool

1 篇文章- 【深度翻譯】Ponytail:教 AI agent 學最懶的資深工程師——最好的程式碼是你沒寫的那一行 — 2026-06-15## tools

3 篇文章- 【深度翻譯】FablePool:群眾集資一個 prompt,AI 幫你做出來——而且全程公開 — 2026-06-12- 【深度翻譯】Claw Patrol:第一款為 AI agent 設計的開源防火牆,出自 Deno 生態系 — 2026-06-12- 【深度翻譯】Claude Desktop 每開一次就吞你 1.8GB——而且你只用文字聊天 — 2026-06-12## translation

1 篇文章- 【深度翻譯】我用 Claude 設計的次數已經超過 Figma——一個 Jane Street 設計師的告白 — 2026-06-08## trust

1 篇文章- 【深度解析】Anthropic 為 Fable 隱形護欄道歉——但「先藏再說」的預設值,比任何一條護欄都可怕 — 2026-06-12## web

1 篇文章- 【深度翻譯】FablePool:群眾集資一個 prompt,AI 幫你做出來——而且全程公開 — 2026-06-12## weekly

4 篇文章- LLM 週報:華盛頓開始發 AI 入場券——而你不在名單上 — 2026-06-28- LLM 週報:Shazeer 與 Jumper 換陣營的那一週——AI 人才戰爭進入核彈級 — 2026-06-21- LLM 週報:Amazon 一通檢舉電話讓 Anthropic 全球下架——當「安全」變成最好用的武器 — 2026-06-14- 【LLM 週報】2026 年 06 月 13 日 — Anthropic 的魔幻一天:一邊說 coding 已死、一邊把 Claude 塞進銀行 — 2026-06-13