2026年4月9日 周四晚上19:30分,来了解“从个人单点提效,到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

不再触发Claude使用限制,大幅降低Token的10个有效习惯!

发布日期:2026-04-07 07:57:53 浏览次数: 1546
作者:Datawhale

微信搜一搜,关注“Datawhale”

推荐语

Claude使用限制的真相:不是消息数量而是Token消耗!掌握这10个习惯,轻松避开"usage limit reached"提示。

核心内容:
1. 编辑提示词而非追加新消息,避免Token成本指数级增长
2. 定期开启新对话并总结历史,减少重复读取消耗
3. 合并多个问题为单条消息,降低上下文加载次数

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 Datawhale干货 

编辑:Datawhale团队

最近刷到一篇关于 Claude 使用限制的文章,X博主 kaize 分享了自己从频繁超限到游刃有余的经验。看完才发现,原来大多数人都误会 Claude 了——它限制的不是消息数量,而是 token 数量。

这篇文章梳理了 10 个实用习惯,帮你大幅降低 Token 消耗。如果你也经常遇到“usage limit reached”的提示,这篇文章值得收藏。

大幅降低 Token 消耗的10个有效习惯(记得收藏)

1. 第一个习惯:多去编辑你的提示词 ☑️

当 Claude 没有理解你的意思时,我们很容易会忍不住发送:

  • “不,我的意思是……”

  • “唉,这不是我想要的……”

千万别这么做!

每条新消息都会被追加到对话历史中。而 Claude 每次回复时,都会重新读取整个对话历史——包括那些没用的纠错消息。

Token 成本的计算公式是这样的:

每条消息的成本 = 所有之前的消息 + 你的新消息

用数学公式表示就是:

总成本 =  S × N(N+1) / 2(S = 每轮平均 Token 数,N = 消息条数)

以每轮对话约 500 Token 为例:

  • 5 条消息:7,500 tokens

  • 10 条消息:27,500 tokens

  • 20 条消息:105,000 tokens

  • 30 条消息:232,000 tokens

第 30 条消息的成本是第 1 条的 31 倍!

正确做法:点击原始消息的“编辑”按钮 → 修改内容 → 重新生成。这样旧的对话会被替换,而不会叠加。

image.png

2. 第二个习惯:每 15~20 条消息就开新对话 ☑️

在上一节我们看到,token 成本会随着消息数量快速增长。

设想一下,如果一个对话有 100 多条消息会怎样?按每轮 500 token 计算,总消耗会超过 250 万 token——其中大部分都只是在重复读取历史记录。

有开发者统计过自己的使用情况,发现 98.5% 的 token 都用在了重读历史记录上,只有 1.5% 真正用于输出结果。

image.png

解决方案很简单:

当对话变长时 → 让 Claude 总结整个对话 → 复制总结 → 开启新对话 → 把总结粘贴为第一条消息。

这样你保留了上下文,但大幅减少了 token 消耗。

建议:理想情况下,每 15-20 条消息就应该开启新对话。

3. 第三个习惯:把问题合并成一条消息发送 ☑️

很多人觉得把问题拆成多条消息会得到更好的结果。但实际上,恰恰相反。

  • 三个独立的提示词 = 三次上下文加载

  • 一个包含三个任务的提示词 = 一次上下文加载

通过一段提示词,你能节省两倍的 token:减少上下文加载的次数,就不容易达到额度的上限。

比如,很多人会这样做:

"总结这篇文章" "现在列出要点" "再给我建议一个合适标题" 

但更好的方式是: 

对这篇文章进行总结,列出主要要点,并给一个合适的标题建议。 

额外的好处:这么做之后,答案往往更好,因为 Claude 能一次性看到完整的需求。

记住:三个问题,一段提示词,永远如此!

4. 第四个习惯:把常用文件上传到项目(Projects)☑️

如果你把同一份 PDF 上传到多个对话,Claude 每次都会重新对文档进行 Token 化处理。

请改用"项目"功能:

上传文件一次 → 它会被缓存 → 该项目内的每个新对话都可以引用它,不会多次消耗 token。

缓存的项目内容在重复访问时不会消耗你的使用额度。如果你经常处理合同、简报、风格指南或其他长文档,光这一点就能大幅降低你的 token 开销。

5. 第五个习惯:设置记忆与用户偏好 ☑️

你可能见过很多人在每个提示词开头都加上“扮演一个……”,这样 AI 的回答效果会更好。

但如果每次新对话都要花 3-5 条消息来设置同样的上下文,比如反复说明:

“我是一名营销人员,我喜欢用轻松的风格写作,偏好短段落……”

这是在重复浪费 token。

Claude 有一个功能,可以永久记住这些设置。

进入“设置” → “记忆和用户设置”,把你的角色、沟通风格和偏好设置保存,Claude 会在每次新对话中自动应用这些设置。

6. 第六个习惯:关闭不需要的功能 ☑️

网页搜索、连接器和“探索”模式——这些功能即使你用不到,也会在每次回复中额外消耗 Token。

如果你只是在写自己的内容:关闭"搜索与工具"功能。

"深度思考"功能同样消耗 Token。默认保持关闭状态,只在第一次尝试结果不满意时再开启。

原则:如果你没有主动打开某个功能,那就把它关掉。

7. 第七个习惯:简单任务用 Haiku,复杂任务才用 Sonnet、Opus ☑️

语法检查、头脑风暴、格式调整、快速翻译、简短回答——Haiku 就已经能处理这些了,成本还比 Sonnet 或 Opus 低得多。

选对模型,是你每天最重要的决策。

用 Haiku 处理草稿和简单任务 → 为真正需要强大模型的任务节省 50-70% 的预算。

选模型的基本思路:

  • Haiku → 快速小任务,成本最低

  • Sonnet → 日常核心工作,成本居中

  • Opus → 深度推理,成本最高

记住:简单任务不需要动用强大模型!

8. 第八个习惯:把工作分散到全天 ☑️

Claude 系统采用滚动 5 小时窗口机制。额度不会在午夜重置,而是持续动态递减——早上 9 点发送的消息,到下午 2 点就不再占用额度了。

如果你在一个上午的会话中用完了整个限制,那么你当天的大部分额度都会闲置浪费。

把你的一天分成 2-3 个时段:早上、下午和晚上。当你回来时,之前的使用量已经不再计入,你又有了新的额度。

9. 第九个习惯:避开高峰时段 ☑️

从 2026 年 3 月 26 日开始:Anthropic 会在高峰时段更快地消耗你的 5 小时会话额度:

工作日的太平洋时间上午 5:00 至 11:00北京时间晚上 8:00 至凌晨 2:00

同样的对话、同样的问题——但在高峰时段,对额度的影响更大。

每周总额度不变,但分配方式已经改变。在非高峰时间处理资源密集型任务,能让你的套餐使用效率大幅提升。

10. 第十个习惯:开启超量使用作为兜底保障 ☑️

Pro、Max 5x 和 Max 20x 套餐的订阅用户,可以在"设置"→"用量"中开启"超量使用"功能。

当会话额度耗尽时,Claude 不会直接阻止你访问,而是会切换到按 API 费率的按需计费。

这个设置可以确保你不会在最关键的时刻突然断线

写在最后:养成习惯,就能省钱

一开始要同时遵守所有规则会比较难,但一旦养成习惯,你几乎再也不会触碰使用上限。

你甚至可能从 Max 套餐降级到普通套餐——Token 完全够用!

记住:Claude 计算的不是消息条数,而是 Token 数量。

明白这一点,你就掌握了主动权!

图片

一起“三连

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询