微信扫码
添加专属顾问
我要投稿
Claude Code 烧钱太猛?5个实用技巧帮你轻松省下一半token成本! 核心内容: 1. 分析Claude Code烧钱的5大原因 2. 5个实用省钱技巧详解(模型选择/上下文控制等) 3. 推荐优化工具和订阅方案
很多人用claudeCode都一个错觉:
1、我只写了几个小功能,token就没了
2、一天随随便便用了几十美元的token,算下来甚至怀疑,难道比请个实习生还贵!
别慌,今天交给你5个省钱的小妙招,亲测下来,用好了,能省下一半的token。
先把底层逻辑给大家讲清楚,不然你只会一边心疼钱,但是一边继续烧钱。
1、每次对话都要重新读取上下文,聊得越久,花的越多。
2、系统内置prompt提示词约占18k的提示词,基本上还没开始干活,先交token
3、opus模型超级贵,比sonnet模型贵很多
4、很多人为了保证质量,写了很多rulues,.claude/rules/ 这个玩意可是每条消息都会加载。
那么知道原理了,我们就知道在哪里省下成本了?
第一条:普通任务用sonnet,特殊任务用****opus。
看到sonnet4.6基本上能省下40%的token。
其实随着模型能力的加大,普通模型sonnet4.6已经能满足90%以上的任务,剩下的疑难杂症再实用opus解决。
实操方法
# 切换模型
/model sonnet
# 或启动时指定
claude --model sonnet
第二条:控制上下文在 60% 以下
上下文长度加大,会导致后面每条消耗的token增多。而且上下文的增多简洁来说是AI的负担。
譬如本来你改A的功能,结果把b的对话也放到上下文中,导致了AI的成功率降低。
因此,你需要做的是:
1、控制上下文60%以下
2、每次新的功能,新开窗口。
3、用claude.md来保存记忆,而不是用
第三条:用rules 还是用skills?
这不是一个选择,能用skills
你电脑定义100条规则,那么每次对话都会加载这100条规则
但是100个skills,可能只会用到1-2个。
要做的就是检查.claude/rules的规则,看看有什么内容,把不常用的移动到skill中。
需要的时候用 /skill xxx来加载。
第四条:依赖图工具减少文件读取
claude读取文件是线性的,很多时候会检索出来不必要的内容。
因此可以用一些工具,把文件读取改成依赖读取。
推荐下面这个几个:
ast-grep — 结构化代码搜索
Serena — 语言服务器包装
第五条:能用max订阅就用max订阅吧!
很少有直接用官方API,大部分都是用第三方API的。
缺点:
1、上下文比较短
2、逆向做的那种偷梁换柱严重。
因此,能用官方的还是用官方吧。注册尼日利亚icloud账号、土耳其账号充值能省下不少钱呢
Claude Code 是个好工具,但不会用就是烧钱机器。
我日常的工作流:
默认sonnet,遇到难题切换opus,上下文超过60%,直接new新的对话框。
目前已经用claude做出多个小程序、海外站等内容,很多坑都是一路踩下来的。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-09
谁来给企业端即将大规模入职的Agent盖办公室?
2026-05-09
鹅厂员工觉得好的code模型应该具备什么能力?
2026-05-09
Markdown要被抛弃了?Claude Code工程师自曝:我已彻底放弃使用Markdown!团队倾向使用HTML!网友:其他编辑工具会被淘汰吗?
2026-05-09
“Claude Code 你就作吧,我换 Codex 了”
2026-05-09
LLM 输出到这步才算可靠:生产级输出验证与质量工程实战
2026-05-09
OpenAI发布Codex for Chrome,能自动操控浏览器干活了!
2026-05-08
Codex Chrome 插件实测:多标签并行后,AI 浏览器代理终于顺手了
2026-05-08
AI吞噬软件的叙事要分化了?
2026-04-15
2026-03-31
2026-03-13
2026-02-14
2026-04-07
2026-03-17
2026-03-17
2026-03-21
2026-04-07
2026-02-20
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07
2026-04-26
2026-04-22
2026-04-18