我要投稿

【AI助手】用长期记忆去掉AI爱总结的毛病

发布日期：2024-06-14 05:02:21 浏览次数： 2395

作者：A思维痕迹I

微信搜一搜，关注“A思维痕迹I”

在打造一系列知识助手的过程中，笔者反复在思考一个问题，大模型不能完全遵循人类的想法，到底有什么办法可以解决？当然，这里指的是合规合法的内容。比如我想让它列出故事的内容，它不能精准地做到，这就造成一种苦恼和矛盾，实际上它有能力做到，但是它不做，或者说控制不止自己。再比如，它列出故事之后都会习惯性地加上自己的讲解或总结，这个也是笔者不想要的，实际场景也很好理解，比如看完一部电影，就不想要听别人的评论，希望可以自己消化总结，当然听别人的看法是有好处的，但不是这种硬塞过来的评论。从大模型的设计机制上来考虑，就会想是不是它就是被设计成这样子，它的底层结构和算法就会导致这种结果，是白璧之瑕吗？经过笔者的测试，大模型确实很顽固，但是，智能体却是可朔之才。怎么说，给大模型加上人设，然后开启它的长期记忆，我们就能把智能体训练得越来越聪明。

新建一个智能体，然后开启它的长期记忆：

接着给它设定人设：

就像人工智能专家给AI设定基本准则一个道理，我们也用一样的格式给它设定一些规则。这个规则设定是一个不断优化的过程，不同的大模型有不同的“脾性”，可以根据它的具体表现，增添不同的规则。

起初，大模型还是不能很好地遵守规则：

需要提醒它，它才能意识到错误：

经过多次提醒，它就能从长期记忆中学到东西了：

解决完大模型这个毛病后，进而延伸出来的问题就是，我们应该依赖这种提示词优化，还是等大模型的训练。大模型有针对性地训练肯定是更有效果的，就像奥特曼说过的，新模型（意指GPT-4o或GPT-5）会让许多创业公司的努力变得白费。但是，我们也不能小视用提示词进行微调的作用，事实证明智能体微调是有潜力的。同时，一旦我们察觉某个方面的优化是有价值的，我们也可以尝试让更多人意识到这方面的价值，反向推动大模型自身的优化。

OK，就到这。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-10-31

OpenAI 公开 Atlas 架构：为 Agent 重新发明浏览器

2025-10-31

Palantir 本体论模式：重塑企业 AI 应用的 “语义根基” 与产业启示

2025-10-31

树莓派这种“玩具级”设备，真能跑大模型吗？

2025-10-30

Cursor 2.0的一些有趣的新特性

2025-10-30

Anthropic 发布最新研究：LLM 展现初步自省迹象

2025-10-30

让Agent系统更聪明之前，先让它能被信任

2025-10-30

Rag不行？谷歌DeepMind同款，文档阅读新助手：ReadAgent

2025-10-29

4大阶段，10个步骤，助你高效构建企业级智能体（Agent）

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

DeepSeek V3.1 测评

2025-08-19

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

DeepSeek突然更新V3.1：实测后才发现的亮点与槽点

2025-08-19

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

DeepSeek v3.1 到底有多强？与 Claude Code 一起实测！

2025-08-20

大家都在问

树莓派这种“玩具级”设备，真能跑大模型吗？

2025-10-31

大模型的Funcation Calling是什么？

2025-10-29

向量搜索已过时，混合搜索都有三大流派了！你看好哪个流派？

2025-10-29

BCG最新报告：企业如何跨越AI价值鸿沟，进入复利增长？

2025-10-28

如何用飞书多维表格快速搭建一个可落地应用？

2025-10-28

当AI学会“听”：声音识别到声音理解，AI到底是怎么听懂的？

2025-10-27

如何让你的内容出现在AI生成的答案中？

2025-10-26

2025，为何“体感上没有AI爆款应用”？

2025-10-25

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部