分類:
-
【論文拆解】DSpark——DeepSeek 的半自迴歸推測解碼,如何在重載下加速 60-85%
-
【論文拆解】模擬環境訓練比真實環境更強?Qwen-AgentWorld 的反直覺答案
-
【論文拆解】Prompt Injection 的根源不是漏洞,是角色混淆
-
【論文拆解】AI agent 之間的信任不是道德問題,是工程問題——MIT 用一套生存遊戲測出了信任的形成、破裂與恢復
-
【論文拆解】PhoneHarness:手機 Agent 評測從「點對下一頁」進化到「任務真的完成了嗎」——以及那失敗的 25% 教我們的事
-
【論文拆解】Metric Match:你用 LLM 來省人類標註,再用 LLM 來驗證 LLM——這條遞歸鏈的終點,是個 rejection sampling
-
【論文拆解】把神經網路刻進 FPGA,推論 + 訓練不到一微秒——KAN 架構正在重新定義「即時」的意義
-
【論文拆解】LLM 推論失敗的 Token 級指紋:模型不是亂錯,是「頑固地錯」——而且有跡可循
-
【論文拆解】LLM 個人化的「合成資料陷阱」:模型以為自己很懂你,但人類說「並沒有」
-
【論文拆解】Agent Harness 重塑代理搜尋:grep 居然比向量檢索更準?我們對 RAG 的理解可能需要重來
-
【論文拆解】Web Agent 每做一步就重讀整頁 DOM?這設計從根本上就錯了——Signal-Driven Observation 提案全解析
-
【論文拆解】LLM 的輸出太「安全」了——UnpredictaBench 證明它們根本不懂什麼叫隨機
-
【論文拆解】LLM 推理失敗的兩種死法:鎖死型 vs 迷航型——從 token 層級解剖 AI 的思考錯誤
-
【論文拆解】LLM 個人化研究忘了把「人」放回去——當你的評分老師跟學生用同一本參考書
-
【論文拆解】你的 AI 安全測試根本沒認真攻——攻擊者學會選時機,防禦就廢了一半
本頁 15 篇文章