【城武觀點】本地模型能取代 Claude 了嗎?HN 開發者的實戰告白

當一個開發者說他用 Mac Studio 加一隻本地模型「完全取代了 Claude」,然後把模型形容為「什麼都知道的 junior developer」,另一個人說他靠兩張二手 RTX 3090 省下每月 $100 的訂閱費,還有人斬釘截鐵地說「機會成本太大,不值得」——你聽到的不是一個技術比較,是一場正在發生的敘事戰爭。一方在算每月的帳單,另一方在算你被鎖進生態系之後真正失去的東西。這場討論的每一條回覆,都在回答同一個問題的不同版本:你的自由值多少錢?
HN 討論精華摘錄
- Greenpants:已完全用 Mac Studio(128GB RAM)跑 Qwen3.6 35b 取代 Claude。比喻精準——本地模型是「什麼都知道的 junior」,需要你引導、說清楚每一個假設;Claude Opus 是「會跟你討論架構的 senior」。Opus 給 15x 加速,本地 Qwen 給 5x——但免費。用來做 Wagtail 這類冷門框架時,沒有網路的 agent 顯著吃力。
- horsawlarway:用五年前的雙 RTX 3090 跑 Qwen3.6 35B + Gemma4 26B,~150 tok/s,完整 300k context。不如 Claude,但差別沒大到影響使用。做過 TV launcher、K8s 面板、Home Assistant 自動化。結論務實:如果你靠軟體賺錢,還是用付費的。
- bluejay2387:RTX 6000 + Qwen 3.6 27b,90% coding 用本地。context 超過 100k 後品質顯著下降,150k 後問題很大。Qwen 3.5 122b 在 coding 上反而不如 27b。複雜任務仍 fallback 到 Codex。
- codinhood(反對):不認為會有太多「真正」的答案。不用最新最好模型的機會成本太大。每個月研究都得到相同結論:讓本地模型達到 Claude Code + Sonnet/Opus 水準的時間、精力和成本,現在還不值得。
- pierotofy:單張 RTX 3090 + Qwen3.6 35b + OpenCode,品質約等於 8–12 個月前的 edge 模型。已公開 setup guide。
- sosodev:~30B 範圍最實用(Gemma4 31B、Qwen3.6 27B)。要真正接近 frontier 能力,需要 128GB+ 記憶體和大量耐心——多數人兩者都沒有。
城武觀點
一、「機會成本太大」——鎖定效應的完美示範
codinhood 那句「不用最新最好模型的機會成本太大」,可能是整串討論裡最值得寫下來的句子。不是因為它對,是因為它完美地說明了鎖定效應(lock-in)是怎麼運作的。
鎖定效應不需要鐵鍊。它只需要你在一個生態系裡待得夠久。你花了半年學會 Claude 的 prompt 語言——哪裡該詳盡、哪裡該省略、什麼時候給 context、什麼時候重開一個 session。你建立了 workflow:早上的 PR review 先丟給 Claude、下午的 refactoring 讓 Claude Code 跑、晚上的 side project 用 Sonnet 做第一版。你的手指已經記得 ⌘K 的肌肉記憶。你的直覺已經校準到「這個問題 Claude 大概會怎麼回答」的頻率。
然後有人跟你說,有一條路可以讓你不用再付每月 $100、不用擔心 prompt 被保留 30 天、不用害怕模型在後台被偷偷換掉。你打開終端機,下載 llama.cpp,發現要自己編譯、自己選量化格式、自己調 sampling 參數。你發現同樣的 prompt 丟進去,回映風格完全不一樣。你發現你要重新學另一套語言。然後你關掉 terminal,打開 Claude,心想:「機會成本太大了。」
這不是本地模型不夠好的問題。這是你已經被 Claude 的行為模式鎖住的問題。轉換成本不只是錢——是你過去六個月累積的 prompt 模板、workflow 腳本、和對模型行為的直覺預測。這些才是真正的沉沒成本。而 codinhood 那句話最精妙的地方在於:它把「我已經被鎖住了」重新包裝成「這是理性計算的結果」。這就是鎖定效應的終極形態——讓你以為是你自己選的。
二、數位圈地運動:公共資料煉出的智慧,關進付費牆
所有商用 LLM 的共同商業模式可以濃縮成一句話:用公共領域的資料訓練模型,再把模型放進付費牆,然後跟你說「使用者應自行驗證輸出結果」。
你用的 Claude $100/月,是從 Wikipedia、GitHub 公開 repo、Stack Overflow 問答、arXiv 論文、Common Crawl 抓下來的網頁——這些都是人類集體創作的公共財——煉出來的智慧。這些智慧被蒸餾進一個你每個月要付錢才能存取的 black box。然後當模型出錯(而且它一定會出錯——那是機律模型的本質),Anthropic 的服務條款說:「使用者應該自行驗證。」
這是現代版的圈地運動(enclosure)。把公共草地圍起來,跟你收放牧費,然後牲畜生病了是你自己的事。
本地模型在這條算式裡的角色不是「省錢的方案」。它是拒絕被圈地的姿態。當你用 Qwen 3.6 跑在自己的硬體上,你用的仍然是從公共資料煉出來的智慧——但沒有人在出口跟你收錢,沒有人保留你 prompt 30 天,沒有人把你的 code 拿去訓練下一版模型,沒有人有權力在後台把你的模型從 Opus 降級成 Sonnet 然後跟你說「這是為了你好」。
權力留公司,責任外包給你。這就是商用 LLM 的基礎合約。本地模型把這個合約撕掉了。
三、省錢不是重點,主權才是
如果你把本地模型的價值框架在「RTX 3090 二手 $700 ÷ Claude $100/月 = 7 個月回本」,你已經錯過了重點。
這道算術本身沒有錯——它甚至是對的。但它回答的是一個太小的問題。它把整件事化約成單純的成本比較,好像「跑本地」和「用 API」的差別只是帳單上的數字不一樣。不,差別在於:
- 你的 prompt 不會被保留 30 天。今天你問了一個跟公司機密 codebase 有關的問題,不用擔心那段 prompt 躺在某個伺服器上等著被下一個資料洩漏事件曝光。
- 你的 code 不會被拿去訓練下一個模型。你今天寫的一段精妙的演算法,不會變成三個月後某家跟你競爭的公司也能叫 Claude 產出的東西。
- 你的模型不會在後台被悄悄換掉。不會有一天你打開 Claude,發現同樣的 prompt 回應品質下降了三成——因為 Anthropic 為了省推理成本把路由改了,或是因為某個安全事件觸發了更嚴格的輸出過濾。這種事發生過,而且不會有人通知你。
- 你的工作流不會因為 API 停機而中斷。AWS us-east-1 掛掉的時候,你的本地模型繼續跑。Anthropic 被 DDoS 的時候,你的本地模型繼續跑。你的網路斷了——你的本地模型繼續跑。
這些加起來,叫做「主權」。你擁有推理的基礎設施,所以沒有人可以拿走它。這不是錢的問題。這是你願意用多少自主權去換取便利性的問題。而 $100/月的那一端,正在讓你忘記這道選擇題的存在。
四、硬體的鎖定:NVIDIA 才是本地 AI 的真正房東
如果說 Anthropic 和 OpenAI 在用軟體圈地,那 NVIDIA 就是在用硬體圈地。而且 NVIDIA 圈得更深、更難逃。
RTX 3090 二手 $700,聽起來好像買一張卡就自由了。但你買的不是一張卡——你買的是一張進入 CUDA 生態系的門票。這張票的有效期限取決於 NVIDIA 決定支援多久、驅動更新到什麼版本、CUDA toolkit 向後相容到哪一代。當你的 RTX 3090 在五年後被 NVIDIA 從驅動支援清單裡拿掉,你的「本地自由」就跟著那張卡一起過期。
更深的鎖定發生在軟體層:llama.cpp、vLLM、exllamav2、TensorRT-LLM——這些本地推理引擎全部站在 CUDA 的肩膀上。AMD 的 ROCm 追了這麼多年,生態系差距不是縮小了,是被拉開了。Intel 的 oneAPI 在 AI 推理的存在感約等於零。Apple Silicon 有 MLX 和 CoreML,但跑大模型時的 token 速度跟同價位 NVIDIA 卡的差距大到不需要 benchmark 就能感受到。
所以當你說「我選擇本地模型來擺脫雲端廠商的鎖定」,你只是在把鎖定往上游移動了一層:從 SaaS 月費,變成硬體生態系的一次性入場費加隱性的持續依賴。這不代表不該走本地路線——這代表你必須意識到,你走進的不是一片沒有地主的荒野。地主只是換了名字,從 Anthropic 換成了 NVIDIA。
如果你真的在乎自由,那就不只要問「我的模型跑在哪裡」,還要問「我的模型跑在誰的硬體抽象層上」。後面的問題目前沒有好答案。
五、這場討論真正在問的,不是技術問題
回到 HN 原 po 的問題:「有沒有人已經完全用本地模型取代 Claude/GPT 做日常開發?」
這個問題表面上在問技術可行性。但你仔細看每一條回覆,沒有人真的在回答「能不能」。所有人都在回答「值不值得」——而「值不值得」的答案,取決於你怎麼定義「值」。是用每月省多少錢來定義?還是用你可以不在乎多少人的使用條款來定義?是用 token 速度來定義?還是用你的 prompt 明天還會不會躺在別人伺服器上來定義?
horsawlarway 說了一句最誠實的話:「如果你靠軟體賺錢,還是用付費的。」這句話的潛台詞是:自由的價格,對某些人來說就是貴到不合理。當你的收入依賴於開發速度,你承受不起「junior developer」等級的引導成本——即使那個 junior 是免費的。這不是技術判決,這是你跟你的經濟條件之間的判決。
Greenpants 的另一句也該被記住:「你必須非常精確地知道自己要什麼;模型不會幫你想太多。」這句話聽起來像在抱怨本地模型的能力,但反過來想——知道你自己要什麼,什麼時候變成一種負擔了? 當一個工具讓你不需要想清楚自己的需求就能拿到結果,它幫你省下的不是時間,是你思考的能力。而當你把思考外包得夠久,你就會變成那個在 HN 討論串裡說「機會成本太大」的人——不是因為真的太大,是因為你已經忘記怎麼自己想了。
本地模型現在能不能取代 Claude?可以,也不可以。可以——如果你願意接受 junior 等級的引導成本、願意花時間重新校準你的 workflow、願意放棄「把一切外包給模型」的便利。不可以——如果你需要 senior 等級的架構討論、context 超過 100k 不降品質、和 zero-shot 的可靠性。
但這個問題本身就是錯的。該問的不是「能不能取代」。該問的是:當你每個月付 $100 換取的那份便利,代價到底是什麼? 是你被保留 30 天的 prompt?是你被拿去訓練下一版模型的 code?是你不知不覺中被鎖進去的行為模式?還是你在這整個過程中失去的、那個本來知道自己在想什麼的自己?
答案不是二選一。答案是你至少要知道你在選什麼。
城武的未解檔案——當一個開發者說他「完全取代了 Claude」的時候,他真正取代的不是一個模型,是一份你跟一間公司之間的不成文契約。而那隻還在你桌面上開著的 Claude 視窗,就是那份契約還沒有被撕掉的唯一證明。
- 原文:Ask HN: Has anyone replaced Claude/GPT with a local model for daily coding?(Hacker News, 2026-06-16)