分類:
-
【論文拆解】AI agent 之間的信任不是道德問題,是工程問題——MIT 用一套生存遊戲測出了信任的形成、破裂與恢復
-
【論文拆解】PhoneHarness:手機 Agent 評測從「點對下一頁」進化到「任務真的完成了嗎」——以及那失敗的 25% 教我們的事
-
【速報】MiniMax M3 開源權重正式釋出:首個同時具備前沿 Coding、1M 上下文、原生多模態的開放模型
-
【論文拆解】Metric Match:你用 LLM 來省人類標註,再用 LLM 來驗證 LLM——這條遞歸鏈的終點,是個 rejection sampling
-
【深度翻譯】GPT-NL:荷蘭用 €13.5M 公共資金打造主權語言模型,跟矽谷的帳單正面對決
-
【城武觀點】本地模型能取代 Claude 了嗎?HN 開發者的實戰告白
-
【深度分析】歐洲不需要 OpenAI 或 Anthropic:Euromesh 的聯邦算力反擊
-
【深度分析】當 AI 實驗室變成宮鬥劇:Anthropic 人事衝突如何癱瘓了全球模型
-
【深度翻譯】TCS 與 Anthropic 結盟:五萬名員工當白老鼠,把 Claude 推進銀行、保險、醫療的監管高牆內
-
【深度解析】里約市政府的「自研 AI」鬧劇:397B 參數的模型,其實是別人的程式碼拼裝車
-
【深度翻譯】Ponytail:教 AI agent 學最懶的資深工程師——最好的程式碼是你沒寫的那一行
-
【深度翻譯】HEAL:Google 的醫療 AI 公平性框架——你的模型很準,但對最需要的人夠好嗎?
-
【深度解析】雲端 LLM 淘金熱的盡頭:Apple 的本地 AI 賭注,與 Fable 5 封鎖令敲響的警鐘
-
【深度解析】是 Anthropic 自己求來的:一篇逐條對照 Amodei 政策宣言與政府封殺令的毀滅性評論
-
LLM 週報:Amazon 一通檢舉電話讓 Anthropic 全球下架——當「安全」變成最好用的武器
-
【深度翻譯】消費級雙卡救星:RTX 5080 + 3090 跑 Qwen 3.6 27B Q8,每秒 80+ tokens 實戰配置
-
【深度分析】用「全世界最危險的 AI」做了一款牧羊犬遊戲:Claude Fable 5 的創意邊界在哪裡?
-
【深度分析】當你的投資人打電話給白宮:Amazon 如何觸發 Anthropic 模型的全球封殺令
-
【深度翻譯】「你不就直接上傳 ChatGPT 嗎?」——一位翻譯師的 AI 醒悟實錄
-
【深度翻譯】Anthropic 的監管產業登陸戰:TCS 與 DXC 雙線出擊
本頁 20 篇文章