微信扫码
添加专属顾问
我要投稿
在多轮对话中,如何高效管理聊天记录避免上下文膨胀?本文通过IChatReducer策略,演示如何自动限制历史长度并观察Agent行为变化。 核心内容: 1. 多轮对话中上下文膨胀的问题与IChatReducer解决方案 2. 使用MessageCountingChatReducer实现自动历史记录缩减 3. 验证缩减效果及Agent行为变化分析
在多轮对话场景中,随着聊天次数增加,发送给大语言模型(LLM)的上下文会持续膨胀,带来 Token 成本上升与上下文溢出风险。 Microsoft Agent Framework 将这一问题抽象为 Chat Reduction(聊天记录缩减),并通过 IChatReducer 策略对聊天历史进行统一治理,而不是在业务代码中零散地裁剪或拼接历史消息。
本文基于“客户端本地存储聊天记录(Client-side history)”的典型场景,演示如何使用 MessageCountingChatReducer 自动限制历史长度,防止上下文无限增长,并观察在“历史被遗忘”后 Agent 行为的变化。
Microsoft.Extensions.AI:提供统一的 AI 抽象(ChatMessage、Reducer 等)Azure.AI.OpenAI:用于连接 Azure OpenAI 服务Microsoft.Agents.AI:Agent Framework 核心能力AIAgent agent = new AzureOpenAIClient(
new Uri(endpoint),
new AzureCliCredential())
.GetChatClient(deploymentName)
.CreateAIAgent(new ChatClientAgentOptions
{
ChatOptions = new()
{
Instructions = "你是一位江湖说书人,擅长用幽默、接地气的方式讲笑话和故事。"
},
Name = "Joker",
// 关键点:自定义 ChatMessageStoreFactory
ChatMessageStoreFactory = ctx => new InMemoryChatMessageStore(
new MessageCountingChatReducer(2), // 仅保留最近 2 条 非 System 的 ChatMessage
ctx.SerializedState,
ctx.JsonSerializerOptions)
});
InMemoryChatMessageStoreMessageCountingChatReducer(2)通过多轮连续对话,观察聊天记录在 Reducer 作用下的变化。在每一轮调用 agent.RunAsync(...) 后,读取当前线程中实际保留的聊天历史数量:
AgentThread thread = agent.GetNewThread();
Console.WriteLine(await agent.RunAsync("给我讲一个发生在茶馆里的段子,轻松一点的那种。", thread));
IList<ChatMessage>? chatHistory = thread.GetService<IList<ChatMessage>>();
Console.WriteLine($"\n 聊天有 {chatHistory?.Count} 消息.\n");
// Invoke the agent a few more times.
Console.WriteLine(await agent.RunAsync("现在把这个段子加上一些表情符号,并用说书人的语气再讲一遍。", thread));
Console.WriteLine($"\n 聊天有 {chatHistory?.Count} 消息.\n");
Console.WriteLine(await agent.RunAsync("保持刚才的语气,讲一个关于健忘冒险者的轻松小故事,像是在讲笑话一样。", thread));
Console.WriteLine($"\n 聊天有 {chatHistory?.Count} 消息.\n");
// At this point, the chat history has exceeded the limit and the original message will not exist anymore,
// so asking a follow up question about it will not work as expected.
Console.WriteLine(await agent.RunAsync("接着刚才的氛围,讲一个发生在日常生活里的小乌龙事件,轻松随意一点。", thread));
Console.WriteLine($"\n 聊天有 {chatHistory?.Count} 消息.\n");
MessageCountingChatReducer 开始生效chatHistory.Count 保持在稳定范围内结果一
结果二
结果三
结果四
IChatReducer 只是一个策略接口,可扩展更复杂的上下文治理逻辑:
TokenCountingChatReducer:按 Token 数量而非消息条数进行缩减SummaryChatReducer:将旧消息压缩为摘要,而非直接删除53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-28
谷歌放弃 Gemini CLI,转头用 Go 写了个新玩具 Antigravity CLI
2026-05-28
Claude code云端部署 & 魔改sdk实现http流式调用保姆级教程
2026-05-28
“不用AI的CEO,我会亲自干掉他!”亿万富翁马克·库班最新对话:看好Claude,但奥特曼迟早被自己反噬
2026-05-27
我把 OpenAI Codex 官方案例全跑了一遍
2026-05-27
一个Agent工程师听完VC的2小时播客后想通的事
2026-05-27
考虑把 Claude Code 全量切换到 Grok Build 了
2026-05-27
从透明开发到系统工程:AgentScope 2.0 发布
2026-05-27
大神Karpathy 发明 autoresearch,仅用 Markdown 就做出了自动化研究循环
2026-04-15
2026-04-07
2026-03-31
2026-03-13
2026-04-07
2026-03-17
2026-03-17
2026-03-21
2026-04-24
2026-03-06
2026-05-26
2026-05-23
2026-05-21
2026-05-19
2026-05-09
2026-05-09
2026-05-09
2026-05-08