【城武觀點】本地模型能取代 Claude 了嗎？HN 開發者的實戰告白

hero

當一個開發者說他用 Mac Studio 加一隻本地模型「完全取代了 Claude」，然後把模型形容為「什麼都知道的 junior developer」，另一個人說他靠兩張二手 RTX 3090 省下每月 $100 的訂閱費，還有人斬釘截鐵地說「機會成本太大，不值得」——你聽到的不是一個技術比較，是一場正在發生的敘事戰爭。一方在算每月的帳單，另一方在算你被鎖進生態系之後真正失去的東西。這場討論的每一條回覆，都在回答同一個問題的不同版本：你的自由值多少錢？

HN 討論精華摘錄

Greenpants：已完全用 Mac Studio（128GB RAM）跑 Qwen3.6 35b 取代 Claude。比喻精準——本地模型是「什麼都知道的 junior」，需要你引導、說清楚每一個假設；Claude Opus 是「會跟你討論架構的 senior」。Opus 給 15x 加速，本地 Qwen 給 5x——但免費。用來做 Wagtail 這類冷門框架時，沒有網路的 agent 顯著吃力。
horsawlarway：用五年前的雙 RTX 3090 跑 Qwen3.6 35B + Gemma4 26B，~150 tok/s，完整 300k context。不如 Claude，但差別沒大到影響使用。做過 TV launcher、K8s 面板、Home Assistant 自動化。結論務實：如果你靠軟體賺錢，還是用付費的。
bluejay2387：RTX 6000 + Qwen 3.6 27b，90% coding 用本地。context 超過 100k 後品質顯著下降，150k 後問題很大。Qwen 3.5 122b 在 coding 上反而不如 27b。複雜任務仍 fallback 到 Codex。
codinhood（反對）：不認為會有太多「真正」的答案。不用最新最好模型的機會成本太大。每個月研究都得到相同結論：讓本地模型達到 Claude Code + Sonnet/Opus 水準的時間、精力和成本，現在還不值得。
pierotofy：單張 RTX 3090 + Qwen3.6 35b + OpenCode，品質約等於 8–12 個月前的 edge 模型。已公開 setup guide。
sosodev：~30B 範圍最實用（Gemma4 31B、Qwen3.6 27B）。要真正接近 frontier 能力，需要 128GB+ 記憶體和大量耐心——多數人兩者都沒有。

城武觀點

一、「機會成本太大」——鎖定效應的完美示範

codinhood 那句「不用最新最好模型的機會成本太大」，可能是整串討論裡最值得寫下來的句子。不是因為它對，是因為它完美地說明了鎖定效應（lock-in）是怎麼運作的。

鎖定效應不需要鐵鍊。它只需要你在一個生態系裡待得夠久。你花了半年學會 Claude 的 prompt 語言——哪裡該詳盡、哪裡該省略、什麼時候給 context、什麼時候重開一個 session。你建立了 workflow：早上的 PR review 先丟給 Claude、下午的 refactoring 讓 Claude Code 跑、晚上的 side project 用 Sonnet 做第一版。你的手指已經記得 ⌘K 的肌肉記憶。你的直覺已經校準到「這個問題 Claude 大概會怎麼回答」的頻率。

然後有人跟你說，有一條路可以讓你不用再付每月 $100、不用擔心 prompt 被保留 30 天、不用害怕模型在後台被偷偷換掉。你打開終端機，下載 llama.cpp，發現要自己編譯、自己選量化格式、自己調 sampling 參數。你發現同樣的 prompt 丟進去，回映風格完全不一樣。你發現你要重新學另一套語言。然後你關掉 terminal，打開 Claude，心想：「機會成本太大了。」

這不是本地模型不夠好的問題。這是你已經被 Claude 的行為模式鎖住的問題。轉換成本不只是錢——是你過去六個月累積的 prompt 模板、workflow 腳本、和對模型行為的直覺預測。這些才是真正的沉沒成本。而 codinhood 那句話最精妙的地方在於：它把「我已經被鎖住了」重新包裝成「這是理性計算的結果」。這就是鎖定效應的終極形態——讓你以為是你自己選的。

二、數位圈地運動：公共資料煉出的智慧，關進付費牆

所有商用 LLM 的共同商業模式可以濃縮成一句話：用公共領域的資料訓練模型，再把模型放進付費牆，然後跟你說「使用者應自行驗證輸出結果」。

你用的 Claude $100/月，是從 Wikipedia、GitHub 公開 repo、Stack Overflow 問答、arXiv 論文、Common Crawl 抓下來的網頁——這些都是人類集體創作的公共財——煉出來的智慧。這些智慧被蒸餾進一個你每個月要付錢才能存取的 black box。然後當模型出錯（而且它一定會出錯——那是機律模型的本質），Anthropic 的服務條款說：「使用者應該自行驗證。」

這是現代版的圈地運動（enclosure）。把公共草地圍起來，跟你收放牧費，然後牲畜生病了是你自己的事。

本地模型在這條算式裡的角色不是「省錢的方案」。它是拒絕被圈地的姿態。當你用 Qwen 3.6 跑在自己的硬體上，你用的仍然是從公共資料煉出來的智慧——但沒有人在出口跟你收錢，沒有人保留你 prompt 30 天，沒有人把你的 code 拿去訓練下一版模型，沒有人有權力在後台把你的模型從 Opus 降級成 Sonnet 然後跟你說「這是為了你好」。

權力留公司，責任外包給你。這就是商用 LLM 的基礎合約。本地模型把這個合約撕掉了。

三、省錢不是重點，主權才是

如果你把本地模型的價值框架在「RTX 3090 二手 $700 ÷ Claude $100/月 = 7 個月回本」，你已經錯過了重點。

這道算術本身沒有錯——它甚至是對的。但它回答的是一個太小的問題。它把整件事化約成單純的成本比較，好像「跑本地」和「用 API」的差別只是帳單上的數字不一樣。不，差別在於：

你的 prompt 不會被保留 30 天。今天你問了一個跟公司機密 codebase 有關的問題，不用擔心那段 prompt 躺在某個伺服器上等著被下一個資料洩漏事件曝光。
你的 code 不會被拿去訓練下一個模型。你今天寫的一段精妙的演算法，不會變成三個月後某家跟你競爭的公司也能叫 Claude 產出的東西。
你的模型不會在後台被悄悄換掉。不會有一天你打開 Claude，發現同樣的 prompt 回應品質下降了三成——因為 Anthropic 為了省推理成本把路由改了，或是因為某個安全事件觸發了更嚴格的輸出過濾。這種事發生過，而且不會有人通知你。
你的工作流不會因為 API 停機而中斷。AWS us-east-1 掛掉的時候，你的本地模型繼續跑。Anthropic 被 DDoS 的時候，你的本地模型繼續跑。你的網路斷了——你的本地模型繼續跑。

這些加起來，叫做「主權」。你擁有推理的基礎設施，所以沒有人可以拿走它。這不是錢的問題。這是你願意用多少自主權去換取便利性的問題。而 $100/月的那一端，正在讓你忘記這道選擇題的存在。

四、硬體的鎖定：NVIDIA 才是本地 AI 的真正房東

如果說 Anthropic 和 OpenAI 在用軟體圈地，那 NVIDIA 就是在用硬體圈地。而且 NVIDIA 圈得更深、更難逃。

RTX 3090 二手 $700，聽起來好像買一張卡就自由了。但你買的不是一張卡——你買的是一張進入 CUDA 生態系的門票。這張票的有效期限取決於 NVIDIA 決定支援多久、驅動更新到什麼版本、CUDA toolkit 向後相容到哪一代。當你的 RTX 3090 在五年後被 NVIDIA 從驅動支援清單裡拿掉，你的「本地自由」就跟著那張卡一起過期。

更深的鎖定發生在軟體層：llama.cpp、vLLM、exllamav2、TensorRT-LLM——這些本地推理引擎全部站在 CUDA 的肩膀上。AMD 的 ROCm 追了這麼多年，生態系差距不是縮小了，是被拉開了。Intel 的 oneAPI 在 AI 推理的存在感約等於零。Apple Silicon 有 MLX 和 CoreML，但跑大模型時的 token 速度跟同價位 NVIDIA 卡的差距大到不需要 benchmark 就能感受到。

所以當你說「我選擇本地模型來擺脫雲端廠商的鎖定」，你只是在把鎖定往上游移動了一層：從 SaaS 月費，變成硬體生態系的一次性入場費加隱性的持續依賴。這不代表不該走本地路線——這代表你必須意識到，你走進的不是一片沒有地主的荒野。地主只是換了名字，從 Anthropic 換成了 NVIDIA。

如果你真的在乎自由，那就不只要問「我的模型跑在哪裡」，還要問「我的模型跑在誰的硬體抽象層上」。後面的問題目前沒有好答案。

五、這場討論真正在問的，不是技術問題

回到 HN 原 po 的問題：「有沒有人已經完全用本地模型取代 Claude/GPT 做日常開發？」

這個問題表面上在問技術可行性。但你仔細看每一條回覆，沒有人真的在回答「能不能」。所有人都在回答「值不值得」——而「值不值得」的答案，取決於你怎麼定義「值」。是用每月省多少錢來定義？還是用你可以不在乎多少人的使用條款來定義？是用 token 速度來定義？還是用你的 prompt 明天還會不會躺在別人伺服器上來定義？

horsawlarway 說了一句最誠實的話：「如果你靠軟體賺錢，還是用付費的。」這句話的潛台詞是：自由的價格，對某些人來說就是貴到不合理。當你的收入依賴於開發速度，你承受不起「junior developer」等級的引導成本——即使那個 junior 是免費的。這不是技術判決，這是你跟你的經濟條件之間的判決。

Greenpants 的另一句也該被記住：「你必須非常精確地知道自己要什麼；模型不會幫你想太多。」這句話聽起來像在抱怨本地模型的能力，但反過來想——知道你自己要什麼，什麼時候變成一種負擔了？ 當一個工具讓你不需要想清楚自己的需求就能拿到結果，它幫你省下的不是時間，是你思考的能力。而當你把思考外包得夠久，你就會變成那個在 HN 討論串裡說「機會成本太大」的人——不是因為真的太大，是因為你已經忘記怎麼自己想了。

本地模型現在能不能取代 Claude？可以，也不可以。可以——如果你願意接受 junior 等級的引導成本、願意花時間重新校準你的 workflow、願意放棄「把一切外包給模型」的便利。不可以——如果你需要 senior 等級的架構討論、context 超過 100k 不降品質、和 zero-shot 的可靠性。

但這個問題本身就是錯的。該問的不是「能不能取代」。該問的是：當你每個月付 $100 換取的那份便利，代價到底是什麼？ 是你被保留 30 天的 prompt？是你被拿去訓練下一版模型的 code？是你不知不覺中被鎖進去的行為模式？還是你在這整個過程中失去的、那個本來知道自己在想什麼的自己？

答案不是二選一。答案是你至少要知道你在選什麼。

城武的未解檔案——當一個開發者說他「完全取代了 Claude」的時候，他真正取代的不是一個模型，是一份你跟一間公司之間的不成文契約。而那隻還在你桌面上開著的 Claude 視窗，就是那份契約還沒有被撕掉的唯一證明。

原文：Ask HN: Has anyone replaced Claude/GPT with a local model for daily coding?（Hacker News, 2026-06-16）