實戰筆記

我在 Claude Code 燒掉了多少 token

標題平實陳述不戲劇化。5-10 倍 token 消耗差距是真的，但該用的時候還是用。

23 Apr 2026 — 1 min read

前幾天用 Claude Code 寫了一個功能。寫完看了一下 token 用量，心裡有點複雜。

不是「好多啊」那種複雜。是「原來不同的用法可以差到 5-10 倍」那種。

**差距在哪**

同一個功能，我自己用提示詞一行一行帶著模型寫，大概用 X 個 token。

丟給 Claude Code 自動跑，同樣的功能用了 5-10 倍的量。

為什麼？因為 Agent 模式下，你每一步的上下文都在膨脹。它改一個檔案，要把整個檔案讀進來。它測一個功能，要把測試輸出讀進來。它修一個錯誤，要把錯誤訊息讀進來。

每次互動都在累積上下文。10 步下來，你的 token 消耗指數成長。

**但我還是用**

知道會燒 5-10 倍，我還是用 Claude Code。因為有些任務你不想自己一行一行帶——尤其是重複性高的修改、需要多檔同步改動的場景。

重點不是不用，是知道什麼時候用。

簡單修改自己帶。複雜重構交 Agent。這是我的分界線。

**MCP 用 skill 替代**

另一個發現：Claude Code 裡的 MCP 工具呼叫，每次都要帶整套工具定義進上下文。如果你裝了 20 個 MCP server，每個都有 10 個 tools，那就是 200 個工具定義佔 token。

我的做法是用 skill 替代 MCP。Skill 是文字檔，只在需要的時候載入，不佔常駐上下文。

Read more