我在 Claude Code 燒掉了多少 token

標題平實陳述不戲劇化。5-10 倍 token 消耗差距是真的,但該用的時候還是用。

前幾天用 Claude Code 寫了一個功能。寫完看了一下 token 用量,心裡有點複雜。

不是「好多啊」那種複雜。是「原來不同的用法可以差到 5-10 倍」那種。


**差距在哪**

同一個功能,我自己用提示詞一行一行帶著模型寫,大概用 X 個 token。

丟給 Claude Code 自動跑,同樣的功能用了 5-10 倍的量。

為什麼?因為 Agent 模式下,你每一步的上下文都在膨脹。它改一個檔案,要把整個檔案讀進來。它測一個功能,要把測試輸出讀進來。它修一個錯誤,要把錯誤訊息讀進來。

每次互動都在累積上下文。10 步下來,你的 token 消耗指數成長。


**但我還是用**

知道會燒 5-10 倍,我還是用 Claude Code。因為有些任務你不想自己一行一行帶——尤其是重複性高的修改、需要多檔同步改動的場景。

重點不是不用,是知道什麼時候用。

簡單修改自己帶。複雜重構交 Agent。這是我的分界線。


**MCP 用 skill 替代**

另一個發現:Claude Code 裡的 MCP 工具呼叫,每次都要帶整套工具定義進上下文。如果你裝了 20 個 MCP server,每個都有 10 個 tools,那就是 200 個工具定義佔 token。

我的做法是用 skill 替代 MCP。Skill 是文字檔,只在需要的時候載入,不佔常駐上下文。