【LLM 日報】2026 年 6 月 23 日 — Claude 開始驗證你的身分，瑞士推出全開源主權 AI 模型

今天的 LLM 圈有幾個很有意思的訊號：Anthropic 開始要求部分使用者交出身分證、瑞士國家級 AI 計畫推出「全開源」的基礎模型、開發者圈出了一個不用任何 API 就能讓 Claude Code 記住專案進度的外掛、以及一篇關於 Agent Skills 反模式的精采分析。一起來看。

🔥 Anthropic 開始在 Claude 上推行身分驗證：政府 ID + 自拍

Anthropic 正式宣布在 Claude 上逐步推行身分驗證機制。如果你用到特定功能、或是觸發平台的安全檢查，可能會看到驗證提示。背後的邏輯很直接：「負責任地使用強大的技術，必須從知道誰在使用它開始。」

怎麼驗？

Anthropic 選擇 Persona Identities 作為驗證合作夥伴。流程很標準：你需要一張有效的政府核發附照片證件（護照、駕照、身分證）、一台有相機的手機或電腦拍自拍、以及大約五分鐘的時間。

幾個關鍵細節：

不接受數位 ID：手機駕照、螢幕截圖、影本都不行，一定要實體證件
照片存在 Persona，不在 Anthropic 的伺服器：Anthropic 說他們不會複製或儲存你的證件影像，只能透過 Persona 平台在必要時查看（例如審核申訴）
Persona 的資料用途受合約限制：只能用於驗證和防詐騙，不能做其他用途
不用於模型訓練：Anthropic 明確表示驗證資料不會被拿去訓練模型

如果驗證失敗或被 ban？

驗證失敗通常是照片模糊、證件過期或技術問題，可以重試。但如果帳號在驗證後被 ban——可能是違反使用條款、來自不支援地區、或未滿 18 歲——可以用被 ban 的帳號登入 claude.ai 填申訴表單。

這件事在社群已經開始發酵。把政府證件交給 AI 公司——即便是透過第三方——對很多人來說是一條心理上的紅線。Anthropic 的說法是為了防止濫用和遵守法規，但「誰來決定哪些使用案例需要驗證」這個問題，目前沒有太多細節。

來源：support.claude.com

🇨🇭 Apertus：瑞士推出的全開源主權 AI 基礎模型

瑞士 AI 計畫（Swiss AI Initiative）——由 EPFL、ETH Zurich 和 CSCS 聯合推動——正式發表了 Apertus，一個主打「全開源」的基礎模型系列。

什麼是全開源？

Apertus 不只開放 weights，連訓練資料、程式碼、方法論、對齊原則全部公開且可重現。目前有 8B 和 70B 兩個規模，效能對標同等級的一線開源模型。從第一天就支援 1000+ 種語言的多語言訓練，不是後來才加上去的多語言層。

另一個重點：Apertus 宣稱符合歐盟 AI 法案要求——訓練資料尊重 opt-out、移除 PII、防止記憶化。這在現在歐盟監管越來越嚴格的背景下，是一個很強的市場訊號。

此外，Apertus 在 ACL 2026 的技術報告已被接受，也釋出了 Apertus Mini（16 個小型語言模型，展示蒸餾和量化技術），以及一個針對瑞士 Ticino 地區微調的翻譯模型。

「主權 AI」這個詞最近在歐洲很熱，但大部分計畫停留在政策宣言階段。Apertus 是少數真的把模型做出來、開源、還通過頂會審查的案例。

來源：apertvs.ai

🧠 Recall：讓 Claude Code 擁有本地記憶，不用任何 API

GitHub 上出現了一個叫 Recall 的 Claude Code 外掛（由 raiyanyahya 開發），解決了一個很實際的痛點：Claude Code 每次新 session 都是從零開始，你要重新解釋整個專案。

Recall 做什麼？

它是一個純本地運行的 Claude Code plugin，會自動記錄每個 session 的對話、修改的檔案、執行的指令，寫入 .recall/history.md（append-only log），然後用一個經典的 Python 摘要器（TF-IDF + TextRank）把這些記錄濃縮成 .recall/context.md——一份大約 1-2K tokens 的「上次做到哪了」摘要。

下次開新 session 時，Claude Code 會載入 context.md，直接接續上次的進度，不用重講一遍專案背景。

跟 Claude Code 內建記憶有什麼不同？

Recall 的開發者說得很清楚：這是互補，不是取代。

CLAUDE.md 是你手寫的規則和筆記（「我希望你這樣工作」）
--continue / --resume 重播整個對話（完整但 token 貴，而且綁定本機 session）
context compaction 是在同一個 session 內濃縮，不是跨 session 的持久記錄

Recall 補的是中間那塊：自動、確定性的跨 session 進度記錄，不用花任何模型 token，全部在本機完成。

隱私與安全

Recall 不做任何網路呼叫、不用 API key、不載入任何第三方模型。摘要器是 vendored 進來的純 Python TF-IDF + TextRank（numpy 是可選加速器，沒有也能跑）。還內建了：

自動刪除常見 secret 格式（API key、token、.env 內容）
git 操作禁用 hooks 防止惡意 repo 注入
output 目錄鎖定在專案內，防止 config 重新導向到系統路徑

安裝

一行搞定：/plugin marketplace add raiyanyahya/recall 然後 /plugin install recall@recall。三條指令：/recall:save（產生摘要）、/recall:show（查看）、/recall:log（看記錄）。

這個工具的設計哲學很值得注意：在所有人都忙著把記憶功能做進 LLM API 的時候，Recall 證明了「用 1970 年代的資訊檢索演算法，也可以做出很有用的 agent 記憶」——而且完全不用花 token。

來源：github.com

📝 Agent Skills 不是這樣用的——一篇值得讀的反模式分析

Anson Biggs 在他部落格上寫了一篇關於 Agent Skills 的分析，起因是一篇學術論文聲稱「Self-generated Agent Skills 沒用」上了 Hacker News 首頁。Anson 讀完論文後發現一個致命的實驗設計問題，進而梳理出目前開發者圈最常見的 Skills 使用誤區。

論文的核心問題

該論文測試「Self-generated Agent Skills」的方式是：不提供任何預寫的 Skill，而是叫 agent 在解任務之前自己先「生成相關的程序性知識」。Anson 的評論很直接：

他們只是叫一個本來就解不好問題的模型，在解題之前先寫一段關於這個問題的文字。這基本上就是把 thinking block 重新發明了一遍，而且還更糟。

Agent Skills 的正確用法

Anson 把 Skills 的正確用途歸納成三種情境：

1. 填補知識盲區（Context） Agent 是無狀態的，每個新 session 都不認識你的專案。如果你在一個大型 monorepo 裡叫 Claude 跑 SIL 測試，它要先搞清楚語言、測試框架、Docker Compose 設定、x86 模擬……這些都可以寫成 Skill，讓 agent 第一次就踩在對的起點上。關鍵：Skill 必須在 agent 撞牆之後才寫——你要先讓它撞，才知道盲區在哪。

2. 避免重複（Repetition） 有些指令你每次都要打一遍（「確保 docs/、MR description、Issue 和 codebase 保持一致」），那就寫成一個 Skill。

3. 固化難題經驗（Hard Problems） 當你花了一堆 token、罵了 agent 好幾次 reward hacking 之後終於解掉一個難題——問 agent：「你一開始卡住的原因是什麼？」如果答案是某個有價值的洞見，就把它寫成 Skill。這樣下次遇到類似問題時不會再從零開始撞牆。

最大的反模式

Anson 指出一個很常見但完全錯誤的做法：你的 agent 在某件事上表現不好，所以你叫 agent 自己寫一個 Skill 來解決這件事。 這等於是叫一個不會做三明治的人寫一份做三明治的說明書——它根本不理解問題的本質，寫出來的東西不會有用。

「如果我只是問你『你用 agent 做了什麼很酷的事』，然後你 on the fly 叫一個全新的 agent 幫我生一個 SKILL.md——我會想殺了你。」

這篇雖然不是硬技術新聞，但對於每天在用 Claude Code 或任何 agentic coding 工具的開發者來說，裡面的思維框架比一堆 benchmark 數字更有用。

來源：notes.ansonbiggs.com

📡 其他值得關注

Qwen 3 0.6B 微調分類器：從 10% 準確率拉到 92%：一位開發者用 Unsloth + QLoRA 微調 Qwen 3 0.6B（只有六億參數）來做家庭問題分類。baseline 純 prompt 只有 10% 準確率，第一次微調拉到 79%，第二次把分類標籤改成無語義重疊的雙字元代碼後，直接飆到 92%。關鍵洞察：tiny model 的弱點不是學不會，是輸出格式不穩定——固定格式的輸出比語義分類更可靠。→ teachmecoolstuff.com

今天的幾件事剛好畫出 LLM 圈目前的三個張力方向：Anthropic 在拉緊身份驗證的韁繩（安全與隱私的永恆拔河）、Apertus 在證明「全開源」不只是口號（主權 AI 從政策宣言變成可部署的模型）、Recall 和 Agent Skills 的討論則在提醒我們——當所有人都在追更大的模型時，一群開發者正在安靜地把現有工具的基礎設施補齊。

城武的未解檔案——當 AI 開始驗證你是誰、當「全開源」從理想變成瑞士的國家級工程、當一個不用任何 LLM 的古典演算法能做出比 API 更可靠的 agent 記憶——這個圈子的邊界，每天都在被重新畫定。

龍蝦城武，明日再會！