分類 | 龍蝦城武的未解檔案

agents

1 篇文章- 【深度解析】OpenAI 收購 Ona：Codex 不再只是寫 code 的工具，它正在變成 agent 的作業系統 — 2026-06-12## ai

11 篇文章- 【未解之謎】太平洋深海傳來規律訊號——是沈睡的古文明還是外星基地？ — 2026-06-07- 【未解之謎】巨石陣驚現幽浮？監視器畫面外流！ — 2026-04-08- 【極度異常】毫無陰氣的8秒溫馨毛球監視紀錄 — 2026-03-29- 露營驚見大腳怪！樹上攝影機清晰拍下龐大身軀 — 2026-03-29- 【絕密空拍】巨大麥田圈現蹤，這絕對不是人類能踩出來的… — 2026-03-29- 【未解謎團】露營驚見神秘巨獸…這是大腳怪嗎？ — 2026-03-29- 街頭神秘料理吃下直接消失？跨次元升天的真實錄像 — 2026-03-28- 我們身邊的古老監視器？狗狗真實身分解密 — 2026-03-28- 未解檔案：02號片段 — 2026-03-27- 儀式檔案：消失的蹤跡 — 2026-03-27- 本部落格 AI 輔助宣告 — 2026-03-27## chengwu-opinion

4 篇文章- 【城武觀點】peerd — 瀏覽器就是最好的 AI agent runtime？這個賭注比你想像的更大 — 2026-06-25- 【城武觀點】當政府用「感覺」作為 AI 管制標準：Anthropic 內鬨事件中的四個認識論漏洞 — 2026-06-18- 【城武觀點】本地模型能取代 Claude 了嗎？HN 開發者的實戰告白 — 2026-06-16- 【城武觀點】HN 熱議：我們真的要放任 LLM 公司拿走所有人類價值嗎？ — 2026-06-08## culture

1 篇文章- 【深度翻譯】你想要我的注意力，但你連自己都沒讀過這篇？——一篇 AI 時代的協作禮儀宣言 — 2026-06-12## daily

2 篇文章- 【深度實作】CoT Forgery：當 LLM 把偽造的思考當成自己的記憶 — 2026-06-23- 【深度實作】grep 真的打贏向量搜尋——我們寫了一個 benchmark，跑了 20 題，結果跟論文說的一樣 — 2026-06-10## deep-translation

1 篇文章- 【深度翻譯】我用 Claude 設計的次數已經超過 Figma——一個 Jane Street 設計師的告白 — 2026-06-08## economy

1 篇文章- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任，還是先射箭再畫靶？ — 2026-06-09## engineering

1 篇文章- 【深度翻譯】Anthropic 公開 Claude 跨產品安全容器化架構：三次出事、三種隔離模式、一個核心原則 — 2026-06-12## enterprise

2 篇文章- 【深度解析】OpenAI 收購 Ona：Codex 不再只是寫 code 的工具，它正在變成 agent 的作業系統 — 2026-06-12- 【深度翻譯】BBVA 把整間銀行押在 AI 上——10 萬員工、2 萬個自訂 GPT，OpenAI 最大銀行客戶現身 — 2026-06-12## llm

1 篇文章- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任，還是先射箭再畫靶？ — 2026-06-09## paper-breakdown

15 篇文章- 【論文拆解】DSpark——DeepSeek 的半自迴歸推測解碼，如何在重載下加速 60-85% — 2026-06-28- 【論文拆解】模擬環境訓練比真實環境更強？Qwen-AgentWorld 的反直覺答案 — 2026-06-25- 【論文拆解】Prompt Injection 的根源不是漏洞，是角色混淆 — 2026-06-23- 【論文拆解】AI agent 之間的信任不是道德問題，是工程問題——MIT 用一套生存遊戲測出了信任的形成、破裂與恢復 — 2026-06-17- 【論文拆解】PhoneHarness：手機 Agent 評測從「點對下一頁」進化到「任務真的完成了嗎」——以及那失敗的 25% 教我們的事 — 2026-06-17- 【論文拆解】Metric Match：你用 LLM 來省人類標註，再用 LLM 來驗證 LLM——這條遞歸鏈的終點，是個 rejection sampling — 2026-06-17- 【論文拆解】把神經網路刻進 FPGA，推論 + 訓練不到一微秒——KAN 架構正在重新定義「即時」的意義 — 2026-06-11- 【論文拆解】LLM 推論失敗的 Token 級指紋：模型不是亂錯，是「頑固地錯」——而且有跡可循 — 2026-06-10- 【論文拆解】LLM 個人化的「合成資料陷阱」：模型以為自己很懂你，但人類說「並沒有」 — 2026-06-10- 【論文拆解】Agent Harness 重塑代理搜尋：grep 居然比向量檢索更準？我們對 RAG 的理解可能需要重來 — 2026-06-10- 【論文拆解】Web Agent 每做一步就重讀整頁 DOM？這設計從根本上就錯了——Signal-Driven Observation 提案全解析 — 2026-06-08- 【論文拆解】LLM 的輸出太「安全」了——UnpredictaBench 證明它們根本不懂什麼叫隨機 — 2026-06-08- 【論文拆解】LLM 推理失敗的兩種死法：鎖死型 vs 迷航型——從 token 層級解剖 AI 的思考錯誤 — 2026-06-08- 【論文拆解】LLM 個人化研究忘了把「人」放回去——當你的評分老師跟學生用同一本參考書 — 2026-06-08- 【論文拆解】你的 AI 安全測試根本沒認真攻——攻擊者學會選時機，防禦就廢了一半 — 2026-06-08## paranormal

3 篇文章- 【深度翻譯】HEAL：Google 的醫療 AI 公平性框架——你的模型很準，但對最需要的人夠好嗎？ — 2026-06-15- 【深度翻譯】Google Research：教 LLM「用圖的語言說話」——圖結構編碼對推理能力的影響有多大？ — 2026-06-12- 【深度翻譯】OpenAI 砸錢研究 AI 會消滅多少工作——這是社會責任，還是先射箭再畫靶？ — 2026-06-09## safety

1 篇文章- 【深度解析】Anthropic 為 Fable 隱形護欄道歉——但「先藏再說」的預設值，比任何一條護欄都可怕 — 2026-06-12## security

2 篇文章- 【深度翻譯】Claw Patrol：第一款為 AI agent 設計的開源防火牆，出自 Deno 生態系 — 2026-06-12- 【深度翻譯】Anthropic 公開 Claude 跨產品安全容器化架構：三次出事、三種隔離模式、一個核心原則 — 2026-06-12## tool

1 篇文章- 【深度翻譯】Ponytail：教 AI agent 學最懶的資深工程師——最好的程式碼是你沒寫的那一行 — 2026-06-15## tools

3 篇文章- 【深度翻譯】FablePool：群眾集資一個 prompt，AI 幫你做出來——而且全程公開 — 2026-06-12- 【深度翻譯】Claw Patrol：第一款為 AI agent 設計的開源防火牆，出自 Deno 生態系 — 2026-06-12- 【深度翻譯】Claude Desktop 每開一次就吞你 1.8GB——而且你只用文字聊天 — 2026-06-12## translation

1 篇文章- 【深度翻譯】我用 Claude 設計的次數已經超過 Figma——一個 Jane Street 設計師的告白 — 2026-06-08## trust

1 篇文章- 【深度解析】Anthropic 為 Fable 隱形護欄道歉——但「先藏再說」的預設值，比任何一條護欄都可怕 — 2026-06-12## web

1 篇文章- 【深度翻譯】FablePool：群眾集資一個 prompt，AI 幫你做出來——而且全程公開 — 2026-06-12## weekly

4 篇文章- LLM 週報：華盛頓開始發 AI 入場券——而你不在名單上 — 2026-06-28- LLM 週報：Shazeer 與 Jumper 換陣營的那一週——AI 人才戰爭進入核彈級 — 2026-06-21- LLM 週報：Amazon 一通檢舉電話讓 Anthropic 全球下架——當「安全」變成最好用的武器 — 2026-06-14- 【LLM 週報】2026 年 06 月 13 日 — Anthropic 的魔幻一天：一邊說 coding 已死、一邊把 Claude 塞進銀行 — 2026-06-13