微信扫码
添加专属顾问
我要投稿
Claude使用限制的真相:不是消息数量而是Token消耗!掌握这10个习惯,轻松避开"usage limit reached"提示。核心内容:1. 编辑提示词而非追加新消息,避免Token成本指数级增长2. 定期开启新对话并总结历史,减少重复读取消耗3. 合并多个问题为单条消息,降低上下文加载次数
Datawhale干货
编辑:Datawhale团队
最近刷到一篇关于 Claude 使用限制的文章,X博主 kaize 分享了自己从频繁超限到游刃有余的经验。看完才发现,原来大多数人都误会 Claude 了——它限制的不是消息数量,而是 token 数量。
这篇文章梳理了 10 个实用习惯,帮你大幅降低 Token 消耗。如果你也经常遇到“usage limit reached”的提示,这篇文章值得收藏。
大幅降低 Token 消耗的10个有效习惯(记得收藏)
1. 第一个习惯:多去编辑你的提示词 ☑️
当 Claude 没有理解你的意思时,我们很容易会忍不住发送:
“不,我的意思是……”
“唉,这不是我想要的……”
千万别这么做!
每条新消息都会被追加到对话历史中。而 Claude 每次回复时,都会重新读取整个对话历史——包括那些没用的纠错消息。
Token 成本的计算公式是这样的:
每条消息的成本 = 所有之前的消息 + 你的新消息用数学公式表示就是:
总成本 = S × N(N+1) / 2(S = 每轮平均 Token 数,N = 消息条数)以每轮对话约 500 Token 为例:
5 条消息:7,500 tokens
10 条消息:27,500 tokens
20 条消息:105,000 tokens
30 条消息:232,000 tokens
第 30 条消息的成本是第 1 条的 31 倍!
正确做法:点击原始消息的“编辑”按钮 → 修改内容 → 重新生成。这样旧的对话会被替换,而不会叠加。
2. 第二个习惯:每 15~20 条消息就开新对话 ☑️
在上一节我们看到,token 成本会随着消息数量快速增长。
设想一下,如果一个对话有 100 多条消息会怎样?按每轮 500 token 计算,总消耗会超过 250 万 token——其中大部分都只是在重复读取历史记录。
有开发者统计过自己的使用情况,发现 98.5% 的 token 都用在了重读历史记录上,只有 1.5% 真正用于输出结果。
解决方案很简单:
当对话变长时 → 让 Claude 总结整个对话 → 复制总结 → 开启新对话 → 把总结粘贴为第一条消息。
这样你保留了上下文,但大幅减少了 token 消耗。
建议:理想情况下,每 15-20 条消息就应该开启新对话。
3. 第三个习惯:把问题合并成一条消息发送 ☑️
很多人觉得把问题拆成多条消息会得到更好的结果。但实际上,恰恰相反。
三个独立的提示词 = 三次上下文加载
一个包含三个任务的提示词 = 一次上下文加载
通过一段提示词,你能节省两倍的 token:减少上下文加载的次数,就不容易达到额度的上限。
比如,很多人会这样做:
"总结这篇文章""现在列出要点""再给我建议一个合适标题"
但更好的方式是:
对这篇文章进行总结,列出主要要点,并给一个合适的标题建议。 额外的好处:这么做之后,答案往往更好,因为 Claude 能一次性看到完整的需求。
记住:三个问题,一段提示词,永远如此!
4. 第四个习惯:把常用文件上传到项目(Projects)☑️
如果你把同一份 PDF 上传到多个对话,Claude 每次都会重新对文档进行 Token 化处理。
请改用"项目"功能:
上传文件一次 → 它会被缓存 → 该项目内的每个新对话都可以引用它,不会多次消耗 token。
缓存的项目内容在重复访问时不会消耗你的使用额度。如果你经常处理合同、简报、风格指南或其他长文档,光这一点就能大幅降低你的 token 开销。
5. 第五个习惯:设置记忆与用户偏好 ☑️
你可能见过很多人在每个提示词开头都加上“扮演一个……”,这样 AI 的回答效果会更好。
但如果每次新对话都要花 3-5 条消息来设置同样的上下文,比如反复说明:
“我是一名营销人员,我喜欢用轻松的风格写作,偏好短段落……”
这是在重复浪费 token。
Claude 有一个功能,可以永久记住这些设置。
进入“设置” → “记忆和用户设置”,把你的角色、沟通风格和偏好设置保存,Claude 会在每次新对话中自动应用这些设置。
6. 第六个习惯:关闭不需要的功能 ☑️
网页搜索、连接器和“探索”模式——这些功能即使你用不到,也会在每次回复中额外消耗 Token。
如果你只是在写自己的内容:关闭"搜索与工具"功能。
"深度思考"功能同样消耗 Token。默认保持关闭状态,只在第一次尝试结果不满意时再开启。
原则:如果你没有主动打开某个功能,那就把它关掉。
7. 第七个习惯:简单任务用 Haiku,复杂任务才用 Sonnet、Opus ☑️
语法检查、头脑风暴、格式调整、快速翻译、简短回答——Haiku 就已经能处理这些了,成本还比 Sonnet 或 Opus 低得多。
选对模型,是你每天最重要的决策。
用 Haiku 处理草稿和简单任务 → 为真正需要强大模型的任务节省 50-70% 的预算。
选模型的基本思路:
Haiku → 快速小任务,成本最低
Sonnet → 日常核心工作,成本居中
Opus → 深度推理,成本最高
记住:简单任务不需要动用强大模型!
8. 第八个习惯:把工作分散到全天 ☑️
Claude 系统采用滚动 5 小时窗口机制。额度不会在午夜重置,而是持续动态递减——早上 9 点发送的消息,到下午 2 点就不再占用额度了。
如果你在一个上午的会话中用完了整个限制,那么你当天的大部分额度都会闲置浪费。
把你的一天分成 2-3 个时段:早上、下午和晚上。当你回来时,之前的使用量已经不再计入,你又有了新的额度。
9. 第九个习惯:避开高峰时段 ☑️
从 2026 年 3 月 26 日开始:Anthropic 会在高峰时段更快地消耗你的 5 小时会话额度:
工作日的太平洋时间上午 5:00 至 11:00北京时间晚上 8:00 至凌晨 2:00
同样的对话、同样的问题——但在高峰时段,对额度的影响更大。
每周总额度不变,但分配方式已经改变。在非高峰时间处理资源密集型任务,能让你的套餐使用效率大幅提升。
10. 第十个习惯:开启超量使用作为兜底保障 ☑️
Pro、Max 5x 和 Max 20x 套餐的订阅用户,可以在"设置"→"用量"中开启"超量使用"功能。
当会话额度耗尽时,Claude 不会直接阻止你访问,而是会切换到按 API 费率的按需计费。
这个设置可以确保你不会在最关键的时刻突然断线。
写在最后:养成习惯,就能省钱
一开始要同时遵守所有规则会比较难,但一旦养成习惯,你几乎再也不会触碰使用上限。
你甚至可能从 Max 套餐降级到普通套餐——Token 完全够用!
记住:Claude 计算的不是消息条数,而是 Token 数量。
明白这一点,你就掌握了主动权!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-31
Harness 不是加一行规则那么简单——我从三家顶级公司学到了什么
2026-03-27
别再死磕 PMF 了!AgaaS 时代,中国 To B 创业者的最后一张船票
2026-03-26
7 个 Karpathy 式提示词,让 Claude 变成你的研究员、工程师和思考搭档
2026-03-26
Claude Code终极指令速查表
2026-03-22
SooKool AI 入门系列之 “上下文”
2026-03-18
别再裸用 Claude Code,这 20 个隐藏命令,太爽了
2026-03-16
TRAE 技术专家推荐:6个技巧让你的 Agent 更听话
2026-03-13
OpenAI 发布 Codex 最佳实践指南:AI 编程工作流首次曝光
2026-01-13
2026-02-26
2026-01-29
2026-01-18
2026-01-30
2026-01-17
2026-01-10
2026-02-24
2026-02-04
2026-01-18
2026-02-28
2026-02-12
2026-02-12
2026-02-08
2026-02-05
2026-02-05
2026-01-23
2026-01-21