微信扫码
添加专属顾问
要让AI智能体真正聪明起来,关键在于构建持续学习的系统,而非执着于一次性的完美指令。 核心内容: 1. 智能体为何需要动态反馈而非静态提示词 2. 以社交媒体回复为例说明“差点就成”的挑战 3. 通过原则优先和反馈循环构建可进化的智能体
对于从事判断类工作(judgement-heavy)的智能体(Agent)来说,最初的提示词只是一个起点。最好的智能体能够从团队身上学到什么是"好"的标准,并随着时间推移不断自我进化。
每个人都在尝试为智能体编写更好的提示词。这确实有用,但它忽略了一个重要的挑战:今天你能写出的最好的提示词,一个月后可能就不再是最佳方案了。
你的产品在变化,用户在变化,团队的品味在不断打磨,新的边缘案例不断出现。而且,如果智能体做的工作需要判断力和品味,任何静态的提示词都不可能覆盖它需要知道的一切。
这个问题把我们要问的问题从"如何写出完美的提示词"变成了"如何构建一个在发布后能持续向团队学习的智能体?"
我们在Warp构建一个帮助开发者体验团队处理社交媒体提及时就遇到了这个问题。我们喜欢和用户聊Warp,听取他们的疑问和反馈,认真对待每一个和我们交流的人。我们社区每周产生超过一千条提及!这种情况下小团队根本跟不上。
在很多智能体开发中,核心循环很直接:智能体尝试某件事,检查是否成功了,然后重试。如果是写代码,通常有明确的信号可以用:测试、构建、浏览器检查、命令行输出。
社交媒体回复可没那么简单,因为智能体没有合适的"外部检查"可用。它不能先发一堆公开回复,然后等着看人们是更信任我们还是更不信任我们,去推断品牌调性是否对,然后再重试。这个反馈循环太长、太嘈杂、成本也太高。很多公司内部的有用工作也是如此:客户外联、客服回复、代码审查意见、产品反馈分析、文档、招聘消息。这些都需要知道什么重要、什么时候不该行动。
我们见过很多智能体卡在这种状态:它们"差点就成"。能力显然存在,输出好到让人抱有些希望,但还没好到可以放心信任的程度。团队不停地调整提示词,指望下一个版本能缩小差距。
我认为这是错误的抽象层次。让智能体做对一次不是难点。难点在于构建一个系统,让智能体能从团队已有的工作方式中不断变好。
我们把这个智能体叫做Buzz。Buzz监控Twitter、LinkedIn和其他平台上的Warp提及。当有新提及时,它会决定我们应该回复、点赞、记录还是跳过。如果应该回复,它会起草一条消息并把建议发布到Slack上。
右图:Slack频道里给Buzz的反馈。左图:每日PR,Buzz把技能更新链接到这里。
最终每条回复仍然由我们亲自撰写,但仅此一项就节省了大量时间:团队不再需要盯着每个平台、打开每个话题、决定每个提及是否重要、每次回复都从头开始。我们想在不牺牲有价值的互动或质量的前提下,尽可能自动化一切。每条回复都是公开的,代表我们的品牌,塑造人们对公司的体验。我们需要智能体学习团队是如何看待社区互动的。
Buzz的第一个版本和很多智能体的第一个版本很像:一个长长的检查清单规则。如果有人提到bug,这样说;如果有人把我们和另一个工具比较,那样说;如果有人问价格,提一下这个套餐。
这非常脆弱。提示词越来越长,回复变得机械,智能体一遇到我们没告诉它的情况就出问题。于是我们把技能从规则转向了原则。与其枚举每一个案例,我们写下了指导好回复的持久理念:
这让技能文件变小了,智能体也变得更好了。回复开始变得更像我们真正会说的话,而且智能体能处理更多情况,因为指令不再是一个巨大的决策树。不过,原则只是给了Buzz一个更好的起点。我们无法把所有可能需要的东西都封装进去。
一旦Buzz有了不错的基于原则的技能,我们就开始给它反馈。
它会起草一条回复。我会说哪里有问题,或者写出我会用的回复。然后Buzz会尝试根据反馈更新自己的指令。
这让我们进入了下一个失败模式:智能体想把每个修正都变回一条规则。比如说,如果我说一个回复太像营销了,它就会加一条规则:"永远不要在第一句提到价格。"可迁移的原则更接近于:"如果有人在发泄情绪,先表达同理心,而不是推销。"智能体需要被教会如何从反馈中学习。
于是,我们为这个能力单独构建了一个技能。它会看智能体的建议、人类实际做了什么、以及当前的指令,然后问:实现预期输出缺少或不清楚的是哪个原则?
GitHub上的回复学习技能
学习过程大概是:
这感觉很像教一个新成员加入团队,让他们学习更广泛的想法。一个有用的副作用是,反馈迫使我们更清楚地表达自己的判断。很多品味只存在于人们的脑子里。教智能体逼着它落到纸面上。
这时候,Buzz有了更大拼图的两块:做工作的原则,以及从人类反馈中学习更好的原则的方法。但是,谁来持续教它?我们不想搞定期会议,也不想把它分配给某个人。
Buzz已经把每个提及连同它的建议和草稿回复发布到Slack频道里了,所以我们把反馈界面做得尽可能小:团队用表情符号反应来表示他们实际做了什么,可以在话题里加一条备注。一个点击就足够传递信号;话题提供额外上下文。
然后,Buzz每天收集一次反应和话题反馈,比较它的建议和团队实际做了什么,提取持久的学习成果,更新相关的技能文件,然后打开一个PR。
这个小小的Slack循环让系统在实践中工作了。从智能体获取最大杠杆的方式不是把每个人都变成提示词工程师。而是把工作流程设计成团队的正常判断和品味成为它们的训练信号。
这种系统有一个明显的担忧:你真的想让智能体重写自己的指令吗?是,但不是静默地做。我们通过把智能体技能当作代码来保证安全。
当一个智能体反复做工作,提示词就成了你审查的东西。如果这些指令决定生产行为,它们应该存在于代码库里,有版本历史、审查和回滚。每天的学习智能体不会直接改变生产行为。它打开一个PR,展示它审查了什么反馈、认为应该改什么原则、技能文件的精确diff。人类像审查其他改动一样审查它。
这给了我们自我改进的有用部分,而不放弃控制。Buzz可以持续提出改进,但持久的改动要经过审查,所以我们可以确保它不会全都转向奇怪的方向。
今天,Buzz每个月处理成千上万条来自社交媒体提及。大约一半不需要回复,这意味着团队只把时间花在需要我们关注的提及上——这已经是一个巨大的时间节省。Buzz运行在约15个技能上,涵盖分类、起草、学习、分析和报告。我们用Oz(warp.dev/oz)做智能体管理和编排,所以Buzz可以在后台运行,由定时任务或incoming提及触发。
这让团队能完成更多工作而不增加团队规模,把更多时间花在我们最擅长的事上:知道什么重要,做品味判断,和社区建立关系,以及决定Warp应该给外部的人什么样的感觉。
做判断类工作的智能体需要一种方式,从那些他们试图近似的判断力的人身上学习。
每当我们在构建类似的智能体时,我们记住这三件事:
我不想把人类的判断和品味从系统中移除。我想让它们不断积累。每次团队纠正智能体,下次运行应该好一点。每个持久的改进都应该被审查和check in。
随着时间推移,智能体变得不像某个人写过一次提示词,而更像是团队思维的工作记忆。最好的团队不只是写更好的提示词,他们会构建更好的循环。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-24
2026-04-08
2026-06-08
2026-04-08
2026-05-15
2026-05-15
2026-04-23
2026-04-07
2026-05-06
2026-04-10
2026-06-24
2026-06-24
2026-06-23
2026-06-17
2026-06-10
2026-06-08
2026-05-29
2026-05-27
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。