不再触发Claude使用限制，大幅降低Token的10个有效习惯！

发布日期：2026-04-07 07:57:53 浏览次数： 3036

作者：Datawhale

微信搜一搜，关注“Datawhale”

最近刷到一篇关于 Claude 使用限制的文章，X博主 kaize 分享了自己从频繁超限到游刃有余的经验。看完才发现，原来大多数人都误会 Claude 了——它限制的不是消息数量，而是 token 数量。

这篇文章梳理了 10 个实用习惯，帮你大幅降低 Token 消耗。如果你也经常遇到“usage limit reached”的提示，这篇文章值得收藏。

大幅降低 Token 消耗的10个有效习惯（记得收藏）

1. 第一个习惯：多去编辑你的提示词 ☑️

当 Claude 没有理解你的意思时，我们很容易会忍不住发送：

“不，我的意思是……”
“唉，这不是我想要的……”

千万别这么做！

每条新消息都会被追加到对话历史中。而 Claude 每次回复时，都会重新读取整个对话历史——包括那些没用的纠错消息。

Token 成本的计算公式是这样的：

每条消息的成本 = 所有之前的消息 + 你的新消息

用数学公式表示就是：

总成本 =  S × N(N+1) / 2（S = 每轮平均 Token 数，N = 消息条数）

以每轮对话约 500 Token 为例：

5 条消息：7,500 tokens
10 条消息：27,500 tokens
20 条消息：105,000 tokens
30 条消息：232,000 tokens

第 30 条消息的成本是第 1 条的 31 倍！

正确做法：点击原始消息的“编辑”按钮 → 修改内容 → 重新生成。这样旧的对话会被替换，而不会叠加。

2. 第二个习惯：每 15～20 条消息就开新对话 ☑️

在上一节我们看到，token 成本会随着消息数量快速增长。

设想一下，如果一个对话有 100 多条消息会怎样？按每轮 500 token 计算，总消耗会超过 250 万 token——其中大部分都只是在重复读取历史记录。

有开发者统计过自己的使用情况，发现 98.5% 的 token 都用在了重读历史记录上，只有 1.5% 真正用于输出结果。

解决方案很简单：

当对话变长时 → 让 Claude 总结整个对话 → 复制总结 → 开启新对话 → 把总结粘贴为第一条消息。

这样你保留了上下文，但大幅减少了 token 消耗。

建议：理想情况下，每 15-20 条消息就应该开启新对话。

3. 第三个习惯：把问题合并成一条消息发送 ☑️

很多人觉得把问题拆成多条消息会得到更好的结果。但实际上，恰恰相反。

三个独立的提示词 = 三次上下文加载
一个包含三个任务的提示词 = 一次上下文加载

通过一段提示词，你能节省两倍的 token：减少上下文加载的次数，就不容易达到额度的上限。

比如，很多人会这样做：

"总结这篇文章" "现在列出要点" "再给我建议一个合适标题"

但更好的方式是：

对这篇文章进行总结，列出主要要点，并给一个合适的标题建议。

额外的好处：这么做之后，答案往往更好，因为 Claude 能一次性看到完整的需求。

记住：三个问题，一段提示词，永远如此！

4. 第四个习惯：把常用文件上传到项目（Projects）☑️

如果你把同一份 PDF 上传到多个对话，Claude 每次都会重新对文档进行 Token 化处理。

请改用"项目"功能：

上传文件一次 → 它会被缓存 → 该项目内的每个新对话都可以引用它，不会多次消耗 token。

缓存的项目内容在重复访问时不会消耗你的使用额度。如果你经常处理合同、简报、风格指南或其他长文档，光这一点就能大幅降低你的 token 开销。

5. 第五个习惯：设置记忆与用户偏好 ☑️

你可能见过很多人在每个提示词开头都加上“扮演一个……”，这样 AI 的回答效果会更好。

但如果每次新对话都要花 3-5 条消息来设置同样的上下文，比如反复说明：

“我是一名营销人员，我喜欢用轻松的风格写作，偏好短段落……”

这是在重复浪费 token。

Claude 有一个功能，可以永久记住这些设置。

进入“设置” → “记忆和用户设置”，把你的角色、沟通风格和偏好设置保存，Claude 会在每次新对话中自动应用这些设置。

6. 第六个习惯：关闭不需要的功能 ☑️

网页搜索、连接器和“探索”模式——这些功能即使你用不到，也会在每次回复中额外消耗 Token。

如果你只是在写自己的内容：关闭"搜索与工具"功能。

"深度思考"功能同样消耗 Token。默认保持关闭状态，只在第一次尝试结果不满意时再开启。

原则：如果你没有主动打开某个功能，那就把它关掉。

7. 第七个习惯：简单任务用 Haiku，复杂任务才用 Sonnet、Opus ☑️

语法检查、头脑风暴、格式调整、快速翻译、简短回答——Haiku 就已经能处理这些了，成本还比 Sonnet 或 Opus 低得多。

选对模型，是你每天最重要的决策。

用 Haiku 处理草稿和简单任务 → 为真正需要强大模型的任务节省 50-70% 的预算。

选模型的基本思路：

Haiku → 快速小任务，成本最低
Sonnet → 日常核心工作，成本居中
Opus → 深度推理，成本最高

记住：简单任务不需要动用强大模型！

8. 第八个习惯：把工作分散到全天 ☑️

Claude 系统采用滚动 5 小时窗口机制。额度不会在午夜重置，而是持续动态递减——早上 9 点发送的消息，到下午 2 点就不再占用额度了。

如果你在一个上午的会话中用完了整个限制，那么你当天的大部分额度都会闲置浪费。

把你的一天分成 2-3 个时段：早上、下午和晚上。当你回来时，之前的使用量已经不再计入，你又有了新的额度。

9. 第九个习惯：避开高峰时段 ☑️

从 2026 年 3 月 26 日开始：Anthropic 会在高峰时段更快地消耗你的 5 小时会话额度：

工作日的太平洋时间上午 5:00 至 11:00北京时间晚上 8:00 至凌晨 2:00

同样的对话、同样的问题——但在高峰时段，对额度的影响更大。

每周总额度不变，但分配方式已经改变。在非高峰时间处理资源密集型任务，能让你的套餐使用效率大幅提升。

10. 第十个习惯：开启超量使用作为兜底保障 ☑️

Pro、Max 5x 和 Max 20x 套餐的订阅用户，可以在"设置"→"用量"中开启"超量使用"功能。

当会话额度耗尽时，Claude 不会直接阻止你访问，而是会切换到按 API 费率的按需计费。

这个设置可以确保你不会在最关键的时刻突然断线。

写在最后：养成习惯，就能省钱

一开始要同时遵守所有规则会比较难，但一旦养成习惯，你几乎再也不会触碰使用上限。

你甚至可能从 Max 套餐降级到普通套餐——Token 完全够用！

记住：Claude 计算的不是消息条数，而是 Token 数量。

明白这一点，你就掌握了主动权！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-02

Claude团队：别再逐条喂Prompt，学会给Agent设计循环

2026-07-02

Agent 怎么沉淀技能:把一个好 prompt 变成全队资产

2026-07-01

从 Prompt 到 Skill：专业工作流的结构升级

2026-07-01

别让 AI 写的文档误导用户：从单次 Prompt 到高可信文档工程化实践

2026-06-30

网传 Karpathy 的 CLAUDE.md 曝光，10条铁律管住Claude Code！

2026-06-29

AI Coding 的底层框架：一切优化都是在对抗熵增

2026-06-29

给模型写方法论：拆解一个跨法域隐私审计Skill

2026-06-28

别再手工调 prompt 了，让 Agent 自己改自己的"操作系统"

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

GPT Image 2 提示词图库开源站点来了

2026-04-21

我逆向了 329 条 GPT-Image2 提示词模板，全部开源！

2026-04-25

Karpathy 的 CLAUDE.md，到底解决了什么问题

2026-04-14

Codex 从入门到精通

2026-05-02

50个 Claude Code 日常使用技巧与最佳实践

2026-04-20

Claude Design的提示词被扒出来了，我在里面发现了Anthropic最真实的设计哲学

2026-04-19

AI 工程化实战：如何像设计函数参数一样设计 System Prompt？

2026-04-14

Codex「自我蒸馏」提示词进化版！官方团队给出更强方案，一键打包你的专属工作流

2026-05-25

Opus 4.7 落地了，聊聊我摸出来的使用技巧

2026-04-18

Harness 刚搞懂，Loop Engineering又要火了

2026-06-10

大家都在问

怎么写一份 Claude 真正能看懂的 DESIGN.md 文件？

2026-06-17

Search Agent 要如何构造复杂有效的Query？

2026-05-23

写给产品经理的"AI工程"指南：提示词工程、上下文工程、Harness 工程到底是啥？

2026-05-16

AI 工程化实战：如何像设计函数参数一样设计 System Prompt？

2026-04-14

Google说只有5%的人真正会用AI，他们做对了什么？

2026-02-28

Prompt caching 技术是如何实现 1 折的推理成本优化的？

2026-02-12

几句话就能复刻一个付费Skill，Skills商店还能卖什么？

2026-02-12

从 Prompt 到 Skills：如何把业务流程切开，塞进AI的“技能槽”里？

2026-02-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw