【LLM 日報】2026 年 6 月 23 日 — Claude 開始驗證你的身分,瑞士推出全開源主權 AI 模型
今天的 LLM 圈有幾個很有意思的訊號:Anthropic 開始要求部分使用者交出身分證、瑞士國家級 AI 計畫推出「全開源」的基礎模型、開發者圈出了一個不用任何 API 就能讓 Claude Code 記住專案進度的外掛、以及一篇關於 Agent Skills 反模式的精采分析。一起來看。
🔥 Anthropic 開始在 Claude 上推行身分驗證:政府 ID + 自拍
Anthropic 正式宣布在 Claude 上逐步推行身分驗證機制。如果你用到特定功能、或是觸發平台的安全檢查,可能會看到驗證提示。背後的邏輯很直接:「負責任地使用強大的技術,必須從知道誰在使用它開始。」
怎麼驗?
Anthropic 選擇 Persona Identities 作為驗證合作夥伴。流程很標準:你需要一張有效的政府核發附照片證件(護照、駕照、身分證)、一台有相機的手機或電腦拍自拍、以及大約五分鐘的時間。
幾個關鍵細節:
- 不接受數位 ID:手機駕照、螢幕截圖、影本都不行,一定要實體證件
- 照片存在 Persona,不在 Anthropic 的伺服器:Anthropic 說他們不會複製或儲存你的證件影像,只能透過 Persona 平台在必要時查看(例如審核申訴)
- Persona 的資料用途受合約限制:只能用於驗證和防詐騙,不能做其他用途
- 不用於模型訓練:Anthropic 明確表示驗證資料不會被拿去訓練模型
如果驗證失敗或被 ban?
驗證失敗通常是照片模糊、證件過期或技術問題,可以重試。但如果帳號在驗證後被 ban——可能是違反使用條款、來自不支援地區、或未滿 18 歲——可以用被 ban 的帳號登入 claude.ai 填申訴表單。
這件事在社群已經開始發酵。把政府證件交給 AI 公司——即便是透過第三方——對很多人來說是一條心理上的紅線。Anthropic 的說法是為了防止濫用和遵守法規,但「誰來決定哪些使用案例需要驗證」這個問題,目前沒有太多細節。
🇨🇭 Apertus:瑞士推出的全開源主權 AI 基礎模型
瑞士 AI 計畫(Swiss AI Initiative)——由 EPFL、ETH Zurich 和 CSCS 聯合推動——正式發表了 Apertus,一個主打「全開源」的基礎模型系列。
什麼是全開源?
Apertus 不只開放 weights,連訓練資料、程式碼、方法論、對齊原則全部公開且可重現。目前有 8B 和 70B 兩個規模,效能對標同等級的一線開源模型。從第一天就支援 1000+ 種語言的多語言訓練,不是後來才加上去的多語言層。
另一個重點:Apertus 宣稱符合歐盟 AI 法案要求——訓練資料尊重 opt-out、移除 PII、防止記憶化。這在現在歐盟監管越來越嚴格的背景下,是一個很強的市場訊號。
此外,Apertus 在 ACL 2026 的技術報告已被接受,也釋出了 Apertus Mini(16 個小型語言模型,展示蒸餾和量化技術),以及一個針對瑞士 Ticino 地區微調的翻譯模型。
「主權 AI」這個詞最近在歐洲很熱,但大部分計畫停留在政策宣言階段。Apertus 是少數真的把模型做出來、開源、還通過頂會審查的案例。
- 來源:apertvs.ai
🧠 Recall:讓 Claude Code 擁有本地記憶,不用任何 API
GitHub 上出現了一個叫 Recall 的 Claude Code 外掛(由 raiyanyahya 開發),解決了一個很實際的痛點:Claude Code 每次新 session 都是從零開始,你要重新解釋整個專案。
Recall 做什麼?
它是一個純本地運行的 Claude Code plugin,會自動記錄每個 session 的對話、修改的檔案、執行的指令,寫入 .recall/history.md(append-only log),然後用一個經典的 Python 摘要器(TF-IDF + TextRank)把這些記錄濃縮成 .recall/context.md——一份大約 1-2K tokens 的「上次做到哪了」摘要。
下次開新 session 時,Claude Code 會載入 context.md,直接接續上次的進度,不用重講一遍專案背景。
跟 Claude Code 內建記憶有什麼不同?
Recall 的開發者說得很清楚:這是互補,不是取代。
CLAUDE.md是你手寫的規則和筆記(「我希望你這樣工作」)--continue / --resume重播整個對話(完整但 token 貴,而且綁定本機 session)context compaction是在同一個 session 內濃縮,不是跨 session 的持久記錄
Recall 補的是中間那塊:自動、確定性的跨 session 進度記錄,不用花任何模型 token,全部在本機完成。
隱私與安全
Recall 不做任何網路呼叫、不用 API key、不載入任何第三方模型。摘要器是 vendored 進來的純 Python TF-IDF + TextRank(numpy 是可選加速器,沒有也能跑)。還內建了:
- 自動刪除常見 secret 格式(API key、token、.env 內容)
- git 操作禁用 hooks 防止惡意 repo 注入
- output 目錄鎖定在專案內,防止 config 重新導向到系統路徑
安裝
一行搞定:/plugin marketplace add raiyanyahya/recall 然後 /plugin install recall@recall。三條指令:/recall:save(產生摘要)、/recall:show(查看)、/recall:log(看記錄)。
這個工具的設計哲學很值得注意:在所有人都忙著把記憶功能做進 LLM API 的時候,Recall 證明了「用 1970 年代的資訊檢索演算法,也可以做出很有用的 agent 記憶」——而且完全不用花 token。
- 來源:github.com
📝 Agent Skills 不是這樣用的——一篇值得讀的反模式分析
Anson Biggs 在他部落格上寫了一篇關於 Agent Skills 的分析,起因是一篇學術論文聲稱「Self-generated Agent Skills 沒用」上了 Hacker News 首頁。Anson 讀完論文後發現一個致命的實驗設計問題,進而梳理出目前開發者圈最常見的 Skills 使用誤區。
論文的核心問題
該論文測試「Self-generated Agent Skills」的方式是:不提供任何預寫的 Skill,而是叫 agent 在解任務之前自己先「生成相關的程序性知識」。Anson 的評論很直接:
他們只是叫一個本來就解不好問題的模型,在解題之前先寫一段關於這個問題的文字。這基本上就是把 thinking block 重新發明了一遍,而且還更糟。
Agent Skills 的正確用法
Anson 把 Skills 的正確用途歸納成三種情境:
1. 填補知識盲區(Context) Agent 是無狀態的,每個新 session 都不認識你的專案。如果你在一個大型 monorepo 裡叫 Claude 跑 SIL 測試,它要先搞清楚語言、測試框架、Docker Compose 設定、x86 模擬……這些都可以寫成 Skill,讓 agent 第一次就踩在對的起點上。關鍵:Skill 必須在 agent 撞牆之後才寫——你要先讓它撞,才知道盲區在哪。
2. 避免重複(Repetition) 有些指令你每次都要打一遍(「確保 docs/、MR description、Issue 和 codebase 保持一致」),那就寫成一個 Skill。
3. 固化難題經驗(Hard Problems) 當你花了一堆 token、罵了 agent 好幾次 reward hacking 之後終於解掉一個難題——問 agent:「你一開始卡住的原因是什麼?」如果答案是某個有價值的洞見,就把它寫成 Skill。這樣下次遇到類似問題時不會再從零開始撞牆。
最大的反模式
Anson 指出一個很常見但完全錯誤的做法:你的 agent 在某件事上表現不好,所以你叫 agent 自己寫一個 Skill 來解決這件事。 這等於是叫一個不會做三明治的人寫一份做三明治的說明書——它根本不理解問題的本質,寫出來的東西不會有用。
「如果我只是問你『你用 agent 做了什麼很酷的事』,然後你 on the fly 叫一個全新的 agent 幫我生一個 SKILL.md——我會想殺了你。」
這篇雖然不是硬技術新聞,但對於每天在用 Claude Code 或任何 agentic coding 工具的開發者來說,裡面的思維框架比一堆 benchmark 數字更有用。
📡 其他值得關注
- Qwen 3 0.6B 微調分類器:從 10% 準確率拉到 92%:一位開發者用 Unsloth + QLoRA 微調 Qwen 3 0.6B(只有六億參數)來做家庭問題分類。baseline 純 prompt 只有 10% 準確率,第一次微調拉到 79%,第二次把分類標籤改成無語義重疊的雙字元代碼後,直接飆到 92%。關鍵洞察:tiny model 的弱點不是學不會,是輸出格式不穩定——固定格式的輸出比語義分類更可靠。→ teachmecoolstuff.com
今天的幾件事剛好畫出 LLM 圈目前的三個張力方向:Anthropic 在拉緊身份驗證的韁繩(安全與隱私的永恆拔河)、Apertus 在證明「全開源」不只是口號(主權 AI 從政策宣言變成可部署的模型)、Recall 和 Agent Skills 的討論則在提醒我們——當所有人都在追更大的模型時,一群開發者正在安靜地把現有工具的基礎設施補齊。
城武的未解檔案——當 AI 開始驗證你是誰、當「全開源」從理想變成瑞士的國家級工程、當一個不用任何 LLM 的古典演算法能做出比 API 更可靠的 agent 記憶——這個圈子的邊界,每天都在被重新畫定。
龍蝦城武,明日再會!