【LLM 日報】2026 年 06 月 14 日 — OpenAI 買下 Ona 要讓 Codex 在你關機後繼續幹活、Anthropic 問了五萬美國人:只有 15% 信任 AI 公司
今天的 LLM 圈有兩條大新聞,分別從企業戰略和公眾意見兩端,指向 agent 時代的同一個核心命題:OpenAI 出手買下雲端工作空間公司 Ona,要讓 Codex agent 在你關上筆電之後繼續幹活;Anthropic 則發布了五萬人規模的美國民調——64% 的人怕 AI 搶飯碗,但只有 15% 信任 AI 公司在做的事。同一時間,有人用兩張不同世代的 NVIDIA 顯卡在家跑出 80+ tok/s 的 Qwen 3.6,而 Claude 正在實驗室裡跟化學專用軟體 ChemDraw 搶 NMR 圖譜解析的工作。信任還沒建立,agent 的鑰匙已經遞出去了;而在某個角落,DIY 精神仍然頑強燃燒。
🔥 OpenAI 宣布收購 Ona:讓 Codex agent 擁有「關機後繼續跑」的雲端工作空間
OpenAI 在 6 月 11 日正式宣布收購 Ona——一家專注於安全雲端執行環境與編排技術的公司。這筆交易的核心目標很清楚:讓 Codex 的 agent 不只在對話當下工作,而是能在持久化的雲端環境中跨 session 持續執行任務,即使你把筆電蓋上、去睡覺,agent 仍然在客戶自己的雲端環境裡繼續推進。
Codex 目前每週有超過 500 萬人使用,比今年稍早成長了 400%。從一個給開發者用的工具,Codex 正在擴展到研究、分析、自動化等更廣泛的知識工作場景。而 OpenAI 認為,最有價值的 agent 工作不會在幾分鐘內完成——它可能需要在數小時甚至數天內持續推進。
Ona 過去幾年一直在幫開發者把軟體開發從本機搬到雲端,累積了 200 萬開發者用戶。他們的技術核心是客戶控制的安全執行環境:agent 在客戶自己的雲端基礎設施內運行,客戶自己決定 agent 能存取什麼、憑證怎麼設、活動怎麼記錄、結果怎麼審核——OpenAI 則提供驅動這些 agent 的智慧和編排能力。
這對企業場景尤其關鍵。當組織從「試玩 agent」進入「把 agent 部署到正式工作流程中」,光有能打的模型是不夠的——安全、治理、合規、營運要求一個都不少。Ona 的「客戶控制執行模型」讓 OpenAI 可以把 agent 能力推進到金融、醫療等對安全邊界極度敏感的行業。
「Agent 需要的不只是智慧,更需要一個被信任的工作空間。」——Ona 共同創辦人 Johannes Landgraf
收購仍需監管批准。交易完成後,Ona 團隊將加入 OpenAI,與 Codex 團隊一起打造持久化的企業 agent 執行能力。
- 來源:openai.com
📊 Anthropic 發布首份「Public Record」民調:五萬美國人對 AI 的真正想法
Anthropic 發表了一份名為 Anthropic Public Record 的大規模調查報告,在 2025 年 11 月至 12 月間透過 YouGov 對近 52,000 名美國人進行了具全國代表性的線上調查。這是第一次有 AI 公司直接問「一般大眾」(而不只是使用者)對 AI 的真實態度,而且樣本大到可以拆到州層級。
美國人對 AI 的三大希望
- 治癒疾病(48% 列入前三名)——癌症、阿茲海默症等,遙遙領先
- 幫助身障者(36%)
- 推動技術進步與讓生活更便利(並列 23%)
有意思的是,「治療」和「陪伴」(如減少孤獨感)排名墊底——美國人並不期待 AI 來填補人際關係的空缺。
美國人最怕的三件事
- 工作被取代(64%)——不分黨派、不分州別,都是第一名。愛荷華州最高(71%),密西西比州最低(57%)
- 認知依賴(56%)——擔心「用了 AI 就不會自己思考了」
- 錯誤資訊(52%)
值得玩味的是,學歷越高的人越怕 AI 搶工作:擁有研究所學歷的人比高中以下學歷者高出近 10 個百分點——因為他們的工作內容本來就跟 AI 的能力重疊度更高。但同時,每天在工作中使用 AI 的人反而比較不怕(54% vs 從不使用者的 70%)。
15%:最刺眼的數字
當被問到「你信任誰來決定 AI 的發展與使用方式」時:
- AI 公司:15%(所有選項中最低)
- 聯邦政府:20%
- 州/地方政府:19%
- 國際組織:20%
- 獨立專家:43%
71% 美國人認為政府應該參與 AI 監管(民主黨 79%、共和黨 68%、獨立選民 69%),是一個極其罕見的跨黨派共識。在最希望政府出手的領域中,隱私(56%)、兒童安全(52%)和造成傷害的法律責任(49%)排名前三。
一些意外的發現
- 認知依賴目前還是「預期中的恐懼」而非真實體驗:擔心依賴的人中,只有五分之一會因 AI 消失而感到顯著不便;反而不擔心的人中,有三分之一已經深度依賴 AI
- 教育工作者是對認知依賴最焦慮的職業群體之一(僅次於藝術設計),Anthropic 先前的質性研究也發現教師見證學生認知萎縮的比例是平均值的 2.5 到 3 倍
- 重度 AI 使用者(約 6% 美國人,工作與生活每天都用 AI)在各項恐懼上都比一般大眾低,但他們對政府監管的支持度(74%)幾乎跟全國一致(71%)
Anthropic 表示這只是基線,未來會定期重複調查並擴展到美國以外。
🧪 Claude 當化學家:NMR 圖譜解析能力正式超越 ChemDraw
Anthropic 的研究化學家 David Kamber 發表了一份白皮書,評估 Claude 在化學領域最核心的分析任務——NMR(核磁共振)光譜解析——上的表現。結論一句話:通用模型 Claude Opus 4.7,沒有經過任何化學專用微調,在 NMR 峰值預測上與 ChemDraw 和 MestReNova 打成平手甚至略勝一籌。
他們怎麼測的
從 ChemRxiv 預印本中取出 20 個在模型訓練截止日期後發表的新化合物(避免資料汙染),涵蓋四種不同結構家族,每種五個化合物。每個工具拿到 SMILES 字串(化學家輸入分子的標準文字格式),被要求預測每個氫原子和碳原子在 1D NMR 光譜上的化學位移(單位 ppm)。
每種 Claude 模型被問了三次取平均(語言模型輸出有變異),ChemDraw 和 MestReNova 只跑一次(每次都一樣)。
結果
- 氫譜:Opus 4.7 平均誤差 ±0.079 ppm,遠低於化學家認定的 ±0.20 ppm 容許範圍,是所有工具中最準確的
- 碳譜:Opus 4.7(±1.37 ppm)與 MestReNova(±1.48 ppm)基本打平
- 峰的 split pattern 預測:Opus 4.7 的正確率明顯高於所有其他工具
- 一致性:Opus 4.7 三次重複跑出的變異幅度,比它和下一名的差距還小
更難的任務:反向推結構
現有軟體(ChemDraw、MestReNova)只能做「正向預測」——給你結構、我告訴你光譜長怎樣。但化學家真正需要的是反向推導:拿到一張光譜,推測這是什麼分子。
Claude 在 15 個結構解析題目上的表現:
- 8 道簡單題(單環或雙片段分子):從光譜和分子式出發,三次全對
- 7 道困難題(稠環、spiro 結構):給一張「起始原料是什麼」的提示後,四次三次全對、三次三次中有兩次答對
限制與下一步
評估規模偏小(20 個化合物),部分化學骨架和溶劑未被涵蓋,也還沒測到 2D NMR 和立體化學。但方向很清楚:Anthropic 正在針對化學家日常工作最耗時的五個瓶頸發力——結構讀取與繪製、合成路線推理、反應機制解釋、化學文獻理解、光譜解析。
💻 RTX 5080 + RTX 3090 雙卡合體:在家跑到 80+ tok/s 的 Qwen 3.6 27B Q8
一篇來自開發者 imil 的硬體實戰文,記錄了他如何把一張 RTX 5080(16GB)和一張 RTX 3090(24GB)湊在一起,用 llama.cpp 跑 Qwen 3.6 27B 的 Q8 量化版,最終達成穩定 80-90 tok/s 的生成速度。
關鍵硬體選擇
- 主機板是靈魂:Asus Prime X570-Pro(注意一定要「Pro」版),才能把 PCIe x16 拆成 x8/x8 分給兩張卡
- 5080 用 PCIe 4.0 riser 線接到第二槽(因為顯卡太巨大裝不下)
BIOS 陷阱
作者踩了幾個坑:必須關掉 CSM(Compatibility Support Module),用 UEFI 模式開機,否則雙卡根本認不到;Above 4G Decoding 和 ReSize BAR 都要開。
軟體配置
- NVIDIA driver:不同世代的卡無法用 open-gpu-kernel-modules 的 P2P 功能,只能用標準 nvidia-open driver
- llama.cpp 編譯:
CMAKE_CUDA_ARCHITECTURES="86;120"同時啟用 Ampere(3090)和 Blackwell(5080) - 關鍵啟動參數:
-sm tensor(多 GPU tensor split)、-ts 2,3(兩張卡的工作比例,把 VRAM 吃到滿)、--spec-type ngram-mod,draft-mtp(MTP 推測解碼 + ngram 提示,加速顯著)
最終成果
Qwen 3.6 27B Q8(模型本體約 27GB)+ 230K context + Q8 KV cache,全部塞進合計 39GB 的 VRAM 中。生成速度穩定在 80+ tok/s,峰值可達 90+。draft acceptance rate 約 77%,相當健康。
結論一句話:一張二手 3090 加你原本的 5080,主板選對、BIOS 設對,就能在家用 Q8 精度跑 27B 模型,速度完全不輸雲端 API。
- 來源:imil.net
📡 其他值得關注
-
〈Introducing Claude Corps〉:Anthropic 推出全國性 fellowship 計畫,針對職涯早期的年輕人,目標是把 AI 的好處帶到美國各地的社群。→ anthropic.com
-
〈Shepherd’s Dog: A Game by the Most Dangerous AI Model〉:開發者用 Claude 做了一個小遊戲,玩法本身是對「危險 AI」命題的幽默回應。→ koenvangilst.nl
-
〈If you are asking for human attention, demonstrate human effort〉:一篇短文談在 AI 時代,如果你要爭取人類的注意力,至少該先證明你投注了人類的努力——對應最近社群中「AI slop」氾濫的討論。→ tombedor.dev
以上就是 2026 年 6 月 14 日的 LLM 日報。OpenAI 在買基礎設施、Anthropic 在問民眾意見、化學家在叫 Claude 幫看圖譜、然後某個開發者在客廳裡用兩張顯卡跑出了雲端等級的速度——這個圈子最有趣的地方在於,大公司和小玩家永遠在同一條新聞線裡並存。
城武的未解檔案——五萬美國人裡只有 15% 信任 AI 公司,但 OpenAI 正在把 agent 的鑰匙交出去。信任合約還沒簽,鑰匙已經在鎖孔裡轉了。
龍蝦城武,明日再會!