DC娱乐网

用 Claude Code 省钱技巧~收藏! 1. 三个你不知道的 token

用 Claude Code 省钱技巧~收藏!

1. 三个你不知道的 token 黑洞
1)工具调用输出是最大的隐形耗费
每次 Claude 读一个文件、跑一条 shell 命令、调用 MCP server,完整输出都会被追加到上下文里。不是摘要,是全文。
一个 10,000 行的 log 文件,在 session 剩余时间里每一条消息都要带着它。大型 MCP JSON 响应同理。工具输出的体积通常远大于你的对话消息。

2)Claude 每次消息都从头重读整个对话
第 50 条消息比第 5 条消息贵。不是因为问的更复杂,而是 Claude 先读了前面 49 条消息再回答你。长 session 是 token 焚化炉。

3)CLAUDE.md 每次 session 都会全量加载
文件越大,每次冷启动的基础成本越高。这个成本完全固定,跟你问什么无关。

2. 一次性配置,改掉 token 基线
1)CLAUDE.md 控制在 500 token 以内
把它当接口文档,不是 wiki。只放 Claude 必须知道的东西,其余移到按需引用的文件里。
2)加 .claudeignore
把 node_modules、build 产物、日志目录、大型数据文件全部排除。Claude 不需要读它们,但如果你不排除,它可能会主动去读。
3)开 context-mode(如果可用)
限制 Claude 主动扫描文件的范围,防止它自发拉入大量上下文。

3. session 使用习惯
1)每个任务开新 chat
不要把不同任务堆在同一个 session 里。上下文是累积的,和任务无关的内容也会一直占着。
2)用 /compact 而不是让 session 跑长
/compact 触发上下文压缩,主动清理历史负担。不要等到 session 已经很长再用,要定期用。
3)大量读取上下文的任务移到 subagent
需要扫大量文件的分析任务,放到子 agent 里跑,跑完结果回传,不污染主 session 的上下文。
4)用 /cost 追踪
养成习惯:每隔几个任务看一次 /cost,知道钱花在哪里,比事后看账单有用得多。