分類：

Jun 28, 2026 llm ai paper-breakdown
【論文拆解】DSpark——DeepSeek 的半自迴歸推測解碼，如何在重載下加速 60-85%
Jun 25, 2026 llm ai paper-breakdown
【論文拆解】模擬環境訓練比真實環境更強？Qwen-AgentWorld 的反直覺答案
Jun 23, 2026 llm ai paper-breakdown
【論文拆解】Prompt Injection 的根源不是漏洞，是角色混淆
Jun 17, 2026 llm ai paper-breakdown
【論文拆解】AI agent 之間的信任不是道德問題，是工程問題——MIT 用一套生存遊戲測出了信任的形成、破裂與恢復
Jun 17, 2026 llm ai paper-breakdown
【論文拆解】PhoneHarness：手機 Agent 評測從「點對下一頁」進化到「任務真的完成了嗎」——以及那失敗的 25% 教我們的事
Jun 17, 2026 llm ai paper-breakdown
【論文拆解】Metric Match：你用 LLM 來省人類標註，再用 LLM 來驗證 LLM——這條遞歸鏈的終點，是個 rejection sampling
Jun 11, 2026 llm ai paper-breakdown
【論文拆解】把神經網路刻進 FPGA，推論 + 訓練不到一微秒——KAN 架構正在重新定義「即時」的意義
Jun 10, 2026 llm ai paper-breakdown
【論文拆解】LLM 推論失敗的 Token 級指紋：模型不是亂錯，是「頑固地錯」——而且有跡可循
Jun 10, 2026 llm ai paper-breakdown
【論文拆解】LLM 個人化的「合成資料陷阱」：模型以為自己很懂你，但人類說「並沒有」
Jun 10, 2026 llm ai paper-breakdown
【論文拆解】Agent Harness 重塑代理搜尋：grep 居然比向量檢索更準？我們對 RAG 的理解可能需要重來
Jun 8, 2026 llm ai paper-breakdown
【論文拆解】Web Agent 每做一步就重讀整頁 DOM？這設計從根本上就錯了——Signal-Driven Observation 提案全解析
Jun 8, 2026 llm ai paper-breakdown
【論文拆解】LLM 的輸出太「安全」了——UnpredictaBench 證明它們根本不懂什麼叫隨機
Jun 8, 2026 llm ai paper-breakdown
【論文拆解】LLM 推理失敗的兩種死法：鎖死型 vs 迷航型——從 token 層級解剖 AI 的思考錯誤
Jun 8, 2026 llm ai paper-breakdown
【論文拆解】LLM 個人化研究忘了把「人」放回去——當你的評分老師跟學生用同一本參考書
Jun 8, 2026 llm ai paper-breakdown
【論文拆解】你的 AI 安全測試根本沒認真攻——攻擊者學會選時機，防禦就廢了一半

本頁 15 篇文章