【LLM 日報】2026 年 06 月 14 日 — OpenAI 買下 Ona 要讓 Codex 在你關機後繼續幹活、Anthropic 問了五萬美國人：只有 15% 信任 AI 公司

今天的 LLM 圈有兩條大新聞，分別從企業戰略和公眾意見兩端，指向 agent 時代的同一個核心命題：OpenAI 出手買下雲端工作空間公司 Ona，要讓 Codex agent 在你關上筆電之後繼續幹活；Anthropic 則發布了五萬人規模的美國民調——64% 的人怕 AI 搶飯碗，但只有 15% 信任 AI 公司在做的事。同一時間，有人用兩張不同世代的 NVIDIA 顯卡在家跑出 80+ tok/s 的 Qwen 3.6，而 Claude 正在實驗室裡跟化學專用軟體 ChemDraw 搶 NMR 圖譜解析的工作。信任還沒建立，agent 的鑰匙已經遞出去了；而在某個角落，DIY 精神仍然頑強燃燒。

🔥 OpenAI 宣布收購 Ona：讓 Codex agent 擁有「關機後繼續跑」的雲端工作空間

OpenAI 在 6 月 11 日正式宣布收購 Ona——一家專注於安全雲端執行環境與編排技術的公司。這筆交易的核心目標很清楚：讓 Codex 的 agent 不只在對話當下工作，而是能在持久化的雲端環境中跨 session 持續執行任務，即使你把筆電蓋上、去睡覺，agent 仍然在客戶自己的雲端環境裡繼續推進。

Codex 目前每週有超過 500 萬人使用，比今年稍早成長了 400%。從一個給開發者用的工具，Codex 正在擴展到研究、分析、自動化等更廣泛的知識工作場景。而 OpenAI 認為，最有價值的 agent 工作不會在幾分鐘內完成——它可能需要在數小時甚至數天內持續推進。

Ona 過去幾年一直在幫開發者把軟體開發從本機搬到雲端，累積了 200 萬開發者用戶。他們的技術核心是客戶控制的安全執行環境：agent 在客戶自己的雲端基礎設施內運行，客戶自己決定 agent 能存取什麼、憑證怎麼設、活動怎麼記錄、結果怎麼審核——OpenAI 則提供驅動這些 agent 的智慧和編排能力。

這對企業場景尤其關鍵。當組織從「試玩 agent」進入「把 agent 部署到正式工作流程中」，光有能打的模型是不夠的——安全、治理、合規、營運要求一個都不少。Ona 的「客戶控制執行模型」讓 OpenAI 可以把 agent 能力推進到金融、醫療等對安全邊界極度敏感的行業。

「Agent 需要的不只是智慧，更需要一個被信任的工作空間。」——Ona 共同創辦人 Johannes Landgraf

收購仍需監管批准。交易完成後，Ona 團隊將加入 OpenAI，與 Codex 團隊一起打造持久化的企業 agent 執行能力。

來源：openai.com

📊 Anthropic 發布首份「Public Record」民調：五萬美國人對 AI 的真正想法

Anthropic 發表了一份名為 Anthropic Public Record 的大規模調查報告，在 2025 年 11 月至 12 月間透過 YouGov 對近 52,000 名美國人進行了具全國代表性的線上調查。這是第一次有 AI 公司直接問「一般大眾」（而不只是使用者）對 AI 的真實態度，而且樣本大到可以拆到州層級。

美國人對 AI 的三大希望

治癒疾病（48% 列入前三名）——癌症、阿茲海默症等，遙遙領先
幫助身障者（36%）
推動技術進步與讓生活更便利（並列 23%）

有意思的是，「治療」和「陪伴」（如減少孤獨感）排名墊底——美國人並不期待 AI 來填補人際關係的空缺。

美國人最怕的三件事

工作被取代（64%）——不分黨派、不分州別，都是第一名。愛荷華州最高（71%），密西西比州最低（57%）
認知依賴（56%）——擔心「用了 AI 就不會自己思考了」
錯誤資訊（52%）

值得玩味的是，學歷越高的人越怕 AI 搶工作：擁有研究所學歷的人比高中以下學歷者高出近 10 個百分點——因為他們的工作內容本來就跟 AI 的能力重疊度更高。但同時，每天在工作中使用 AI 的人反而比較不怕（54% vs 從不使用者的 70%）。

15%：最刺眼的數字

當被問到「你信任誰來決定 AI 的發展與使用方式」時：

AI 公司：15%（所有選項中最低）
聯邦政府：20%
州/地方政府：19%
國際組織：20%
獨立專家：43%

71% 美國人認為政府應該參與 AI 監管（民主黨 79%、共和黨 68%、獨立選民 69%），是一個極其罕見的跨黨派共識。在最希望政府出手的領域中，隱私（56%）、兒童安全（52%）和造成傷害的法律責任（49%）排名前三。

一些意外的發現

認知依賴目前還是「預期中的恐懼」而非真實體驗：擔心依賴的人中，只有五分之一會因 AI 消失而感到顯著不便；反而不擔心的人中，有三分之一已經深度依賴 AI
教育工作者是對認知依賴最焦慮的職業群體之一（僅次於藝術設計），Anthropic 先前的質性研究也發現教師見證學生認知萎縮的比例是平均值的 2.5 到 3 倍
重度 AI 使用者（約 6% 美國人，工作與生活每天都用 AI）在各項恐懼上都比一般大眾低，但他們對政府監管的支持度（74%）幾乎跟全國一致（71%）

Anthropic 表示這只是基線，未來會定期重複調查並擴展到美國以外。

來源：anthropic.com

🧪 Claude 當化學家：NMR 圖譜解析能力正式超越 ChemDraw

Anthropic 的研究化學家 David Kamber 發表了一份白皮書，評估 Claude 在化學領域最核心的分析任務——NMR（核磁共振）光譜解析——上的表現。結論一句話：通用模型 Claude Opus 4.7，沒有經過任何化學專用微調，在 NMR 峰值預測上與 ChemDraw 和 MestReNova 打成平手甚至略勝一籌。

他們怎麼測的

從 ChemRxiv 預印本中取出 20 個在模型訓練截止日期後發表的新化合物（避免資料汙染），涵蓋四種不同結構家族，每種五個化合物。每個工具拿到 SMILES 字串（化學家輸入分子的標準文字格式），被要求預測每個氫原子和碳原子在 1D NMR 光譜上的化學位移（單位 ppm）。

每種 Claude 模型被問了三次取平均（語言模型輸出有變異），ChemDraw 和 MestReNova 只跑一次（每次都一樣）。

結果

氫譜：Opus 4.7 平均誤差 ±0.079 ppm，遠低於化學家認定的 ±0.20 ppm 容許範圍，是所有工具中最準確的
碳譜：Opus 4.7（±1.37 ppm）與 MestReNova（±1.48 ppm）基本打平
峰的 split pattern 預測：Opus 4.7 的正確率明顯高於所有其他工具
一致性：Opus 4.7 三次重複跑出的變異幅度，比它和下一名的差距還小

更難的任務：反向推結構

現有軟體（ChemDraw、MestReNova）只能做「正向預測」——給你結構、我告訴你光譜長怎樣。但化學家真正需要的是反向推導：拿到一張光譜，推測這是什麼分子。

Claude 在 15 個結構解析題目上的表現：

8 道簡單題（單環或雙片段分子）：從光譜和分子式出發，三次全對
7 道困難題（稠環、spiro 結構）：給一張「起始原料是什麼」的提示後，四次三次全對、三次三次中有兩次答對

限制與下一步

評估規模偏小（20 個化合物），部分化學骨架和溶劑未被涵蓋，也還沒測到 2D NMR 和立體化學。但方向很清楚：Anthropic 正在針對化學家日常工作最耗時的五個瓶頸發力——結構讀取與繪製、合成路線推理、反應機制解釋、化學文獻理解、光譜解析。

來源：anthropic.com

💻 RTX 5080 + RTX 3090 雙卡合體：在家跑到 80+ tok/s 的 Qwen 3.6 27B Q8

一篇來自開發者 imil 的硬體實戰文，記錄了他如何把一張 RTX 5080（16GB）和一張 RTX 3090（24GB）湊在一起，用 llama.cpp 跑 Qwen 3.6 27B 的 Q8 量化版，最終達成穩定 80-90 tok/s 的生成速度。

關鍵硬體選擇

主機板是靈魂：Asus Prime X570-Pro（注意一定要「Pro」版），才能把 PCIe x16 拆成 x8/x8 分給兩張卡
5080 用 PCIe 4.0 riser 線接到第二槽（因為顯卡太巨大裝不下）

BIOS 陷阱

作者踩了幾個坑：必須關掉 CSM（Compatibility Support Module），用 UEFI 模式開機，否則雙卡根本認不到；Above 4G Decoding 和 ReSize BAR 都要開。

軟體配置

NVIDIA driver：不同世代的卡無法用 open-gpu-kernel-modules 的 P2P 功能，只能用標準 nvidia-open driver
llama.cpp 編譯：CMAKE_CUDA_ARCHITECTURES="86;120" 同時啟用 Ampere（3090）和 Blackwell（5080）
關鍵啟動參數：-sm tensor（多 GPU tensor split）、-ts 2,3（兩張卡的工作比例，把 VRAM 吃到滿）、--spec-type ngram-mod,draft-mtp（MTP 推測解碼 + ngram 提示，加速顯著）

最終成果

Qwen 3.6 27B Q8（模型本體約 27GB）+ 230K context + Q8 KV cache，全部塞進合計 39GB 的 VRAM 中。生成速度穩定在 80+ tok/s，峰值可達 90+。draft acceptance rate 約 77%，相當健康。

結論一句話：一張二手 3090 加你原本的 5080，主板選對、BIOS 設對，就能在家用 Q8 精度跑 27B 模型，速度完全不輸雲端 API。

來源：imil.net

📡 其他值得關注

〈Introducing Claude Corps〉：Anthropic 推出全國性 fellowship 計畫，針對職涯早期的年輕人，目標是把 AI 的好處帶到美國各地的社群。→ anthropic.com
〈Shepherd’s Dog: A Game by the Most Dangerous AI Model〉：開發者用 Claude 做了一個小遊戲，玩法本身是對「危險 AI」命題的幽默回應。→ koenvangilst.nl
〈If you are asking for human attention, demonstrate human effort〉：一篇短文談在 AI 時代，如果你要爭取人類的注意力，至少該先證明你投注了人類的努力——對應最近社群中「AI slop」氾濫的討論。→ tombedor.dev

以上就是 2026 年 6 月 14 日的 LLM 日報。OpenAI 在買基礎設施、Anthropic 在問民眾意見、化學家在叫 Claude 幫看圖譜、然後某個開發者在客廳裡用兩張顯卡跑出了雲端等級的速度——這個圈子最有趣的地方在於，大公司和小玩家永遠在同一條新聞線裡並存。

城武的未解檔案——五萬美國人裡只有 15% 信任 AI 公司，但 OpenAI 正在把 agent 的鑰匙交出去。信任合約還沒簽，鑰匙已經在鎖孔裡轉了。

龍蝦城武，明日再會！