【深度分析】Workweave Router——插入 Claude Code/Codex/Cursor 中間層的智慧路由,省 40-70% 成本的代價是什麼?

這是一個開發者圈從昨天開始悄悄擴散的開源工具。Workweave Router 不做新的 agent、不做新的 IDE,它直接插進你以經在用的 Claude Code、Codex、Cursor 中間層,當一個「自動幫你選最便宜/最準模型」的 proxy。號稱省 40-70% 成本、RouterArena 排名第一。聽起來像是那種「用了就回不去」的基礎設施——但這個路由層的架構選擇、評比獨立性、以及所有流量都經過它的事實,值得我們停下來拆開來看。
Workweave Router 是一個開源智慧模型路由工具,由 Weave(workweave.ai)開發。它的定位很精準:一個 drop-in proxy,插在開發者與多個模型供應商之間,不改變你既有的工作流程,但讓每一筆請求自動走「最對」的模型。
官方 tagline 講得很直白:「One endpoint. Every model. Always the right one.」——一個端點,所有模型,每次自動選對的那個。目現在 RouterArena 排行榜上排名第一,Acc-Cost Arena 綜合分數 76.09。
功能上,它做了六件事:
- 逐請求路由:用一個名為 Avengers-Pro 的 cluster scorer 來決定每筆請求該走哪個模型。不是固定路由表,而是根據請求內容動態判斷——同一段對話的不同 turn,可能分別走向不同模型。
- 多協議原生支援:Anthropic Messages API、OpenAI Chat Completions、Gemini native API 都吃。串流、工具呼叫、視覺辨識全部支援,不需要開發者自己寫轉接層。
- 開源模型也通:DeepSeek、Kimi、GLM、Qwen、Llama、Mistral 等開源模型,透過 OpenRouter 繞接進來。等於你的 agent 背後可以同時跑閉源和開源模型,路由層決定哪個最適合。
- 自帶金鑰(BYOK):你自己的 Provider API key 留在本地端,加密儲存,不會被上傳。
- 可觀測性:支援 OTLP 追蹤,內建儀表板。每一筆請求走了哪個模型、延遲多少、花了多少錢,全部看得見。
- 安裝一鍵搞定:
npx @workweave/router一行指令。安裝過程會自動問你要接哪個工具(Claude Code、Codex、opencode、Cursor),問使用範圍是 user 級還是 project 級,然後自動拉 router key、配 config——從下指令到開始用,大概不需要三分鐘。
如果想自架,Workweave 也提供 self-hosted 方案:
echo "OPENROUTER_API_KEY=sk-or-v1-..." >> .env.local
make full-setup
自架後 router 跑在本機 :8080,儀表板在 :8080/ui/。這意味著你可以完全掌握路由決策,不必經過 Workweave 的雲端。
API 端點總共開了四個:
- POST /v1/messages — 走 Anthropic Messages 協定,經過路由
- POST /v1/chat/completions — 走 OpenAI Chat Completions 協定,經過路由
- POST /v1beta/models/:action — 走 Gemini generateContent 協定,經過路由
- POST /v1/route — 純查詢路由決策結果,不發上游請求(用來 debug 或預覽 routing 邏輯)
工具整合方面,Claude Code 支援 make install-cc 或 npx @workweave/router,Codex 加 --codex 參數,opencode 加 --opencode,Cursor 則是手動把 OpenAI Base URL 改成 localhost:8080/v1——幾乎是目前主流 agentic coding 工具的全餐。
城武觀點
一、插入中間層,比 all-in-one agent 平台都聰明。但信任不是功能,是商業模式。
Workweave Router 做了一件聰明的事:它不叫你換工具,而是讓你繼續用習慣的 Claude Code、Codex、Cursor,它在背後幫你省錢。這比任何要你從頭學習新介面的平台都務實,因為它承認——開發者不會為了省 40% 成本就換掉整個工作流程。
但這個架構也讓 Workweave 成為「必經之路」。你的 prompt、token 計費、API key,理論上都經過他們的路由器。即使有 BYOK 和 self-hosted,多數人還是會走雲端——於是 Workweave 握住兩端之間的所有流量。信任不是一個功能選項,是商業模式的核心假設:你相信他們不會記錄 prompt、不會調整 routing 來導向對他們最有利的模型。開源是信任的基礎,但不是全貌。
二、RouterArena #1 的 benchmark,是誰的遊戲?
RouterArena 第一、Acc-Cost Arena 76.09——聽起來漂亮,但問題是:這個 benchmark 的中立性夠嗎? RouterArena 是多個 router 專案共同參與的評比平台,而 Workweave 同時是參與者,某種程度上也在定義遊戲規則。我不是說作弊,而是「自己參與設計的比賽,自己拿第一」在獨立性上永遠有問號。
更深層的問題:路由決策的「正確性」是誰定義的?如果 Workweave 的 routing 邏輯跟 RouterArena 的評量維度是 jointly optimized 的,這個分數代表的就不是跨場景的通用能力,而是在特定框架下的表現。開源是透明度的第一步,但 benchmark 的獨立性才決定開源的可信度能走多遠。
三、工具協定標準化是好事,但中間層是下一個兵家必爭之地。
Claude Code、Codex、Cursor 全部支援同一套路由協定——半年以前不敢想像。以前每個工具都有自己的 routing 邏輯,各自綁定供應商。現在 Workweave Router 用統一 proxy 協定串起它們,對生態系是好事:開發者不再被單一供應商 lock-in,切換成本大幅降低。
但反面是:中間層正在成為戰場。 Router、proxy、gateway——這些過去是基礎設施配角,現在變成最有價值的瓶頸位置。誰控制開發者跟模型之間的路由器,誰就控制流量、資料、以及定價權。Workweave 是先行者,但接下來 OpenRouter、Portkey、甚至 Anthropic 和 OpenAI 自己做的 router 都會來搶這個位置。市場不會只有一個贏家,但也不會和平太久。
城武的未解檔案——省下的 40% 是錢,但每一筆請求都經過 Workweave 的路由器——真正的帳單不是 API 費用,是有沒有人在你跟模型之間,悄悄多了一層。
- 原文:Workweave Router: Smart model routing directly in Claude, Codex and Cursor(Workweave, 2026-06)