微信扫码
添加专属顾问
我要投稿
腾讯云重磅入局Agent赛道,升级智能体开发平台,打造企业级AI助手新体验! 核心内容: 1. 腾讯云智能体开发平台的核心功能与生态优势 2. 一键发布至企业微信的实战操作指南 3. 合同审核Agent从开发到落地的完整案例解析
各大厂都在这条赛道上卷生卷死,从字节跳动的扣子(Coze),到百度智能云的千帆,再到阿里云的百炼,都在神仙打架。
国内的创业公司和开源社区也没闲着,dify、FastGPT、n8n这些老朋友也在持续进化。
最近,腾讯云也坐不住了。
最近才刚刚发布了他们最新的全栈AI编程IDE工具:CodeBuddy
codebuddy
袋鼠帝,公众号:袋鼠帝AI客栈腾讯入局AI IDE,这次他们直接造了个「AI全栈工程师」
紧接着我就发现,最近他们又悄悄把原来的大模型知识引擎(lke)升级成了智能体开发平台,感觉也要all in智能体赛道。
这个平台2月份的时候试过,RAG效果还挺不错。
之前这个平台给我印象很深的是RAG效果不错
DeepSeek%E8%81%94%E7%BD%91%2B%E7%A7%81%E6%9C%89%E7%9F%A5%E8%AF%86%E5%BA%93%EF%BC%8C%E6%95%88%E6%9E%9C%E7%9B%B4%E6%8E%A5%E6%8B%89%E6%BB%A1%E3%80%90%E5%96%82%E9%A5%AD%E7%BA%A7%E6%95%99%E7%A8%8B%E3%80%91%22%2C%22url%22%3A%22https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FFKQzvHE8oa-QZhBmCzwDQg%22%2C%22nickname%22%3A%22%E8%A2%8B%E9%BC%A0%E5%B8%9DAI%E5%AE%A2%E6%A0%88%22%2C%22authorName%22%3A%22%E8%A2%8B%E9%BC%A0%E5%B8%9D%22%7D%7D">袋鼠帝,公众号:袋鼠帝AI客栈满血版DeepSeek联网+私有知识库,效果直接拉满【喂饭级教程】
所以这次它改名为智能体开发平台之后我还挺好奇,有什么新的变化,到底好不好用,能不能解决真实问题,落地如何。
实际体验后,你还别说,企业级智能体开发平台还得是腾讯云,除了上次分享的知识库问答效果很棒外,它还真有好些亮点值得写一篇文章来说说。
智能体如果只能在开发平台里玩,那价值就大打折扣。
腾讯云智能体开发平台的Agent可以一键发布到企业微信(机器人或者应用)
这也是腾讯生态独有的优势,目前应该很少有智能体平台这么全面、丝滑的支持发布到企微应用和机器人。
然后根据指引配置几个参数就ok了,不过对接到企微应用需要配置备案主体与当前企业主体相同或有关联关系的域名(这个要准备好)
Agent的重点在于自主规划,自主调用工具解决问题。所以我们先看看智能体的工具调用能力。
正好我一直有个需求,就是合同审核,因为之前会接一些智能体定制的活儿。有时候是跟企业合作,就要签合同,一般合同模版啥的都是甲方提供,然后合同这个东西我也不太懂,每次发过来我都看半天。
我就想打造一个AI法务助手,先给我自己用,后面看能不能对外提供服务。
毕竟这玩意还是有需求的
于是说干就干
打开腾讯云智能体开发平台
https://cloud.tencent.com/product/tcadp
新建智能体,选择Muti-Agent模式(这个类型才能添加工具)
第一步:预设提示词
系统prompt那里我们就先简单写,表达清楚就行,也可以点击「优化」让AI生成结构化提示词。
因为我想让整个流程执行快一些,所以我这里选择了DeepSeek V3,并「一键优化」了Prompt
第二步:添加工具
合同一般都是word,所以我们需要一个文件解析工具
点击插件栏的添加,打开插件市场
搜索「文件」
我们找到一个合适的插件「文件解析」,它里面有两个工具,正好适配我们的需求。全部添加
然后我还想要一个搜索企业信息的工具,这样方便审查一下合同中对方企业的资质还有相关信息。
在工具市场中没有搜索到企业信息查询的工具
正好腾讯云智能体开发平台的插件市场,也支持添加外部的MCP工具
于是我打开了mcp.so,搜索企业这个关键词,找到一个叫「水滴大数据企业查询」的MCP-Server
是sse调用方式,正好可以添加到腾讯云智能体开发平台。
复制sse链接:
https://mcp.shuidi.cn/sse
插件广场->接入MCP插件,给插件起个名字,把描述复制过来。
将链接粘贴到URL处,保存
有点可惜的是:腾讯云智能体开发平台目前仅支持以sse(远程调用)的方式添加MCP-Server,不支持本地MCP-Server的添加,希望后面能加上。
如果添加成功,在「我的插件」里面就能看到刚刚添加的MCP-Server
这个MCP-Server的工具贼丰富,有16个!
我们也懒得一个一个看功能了,还是一键全部添加到法务助手智能体
温馨提示:如果是正式环境的智能体,最好还是挑选几个用得上的工具添加,全部添加的话会增加大模型筛选工具的时间,以及会浪费很多token。
最后,为了让整个合同的审核过程更有依据,我还专门搞了一个《合同陷阱》资料文件(由DeepResearch工具全网搜集整理得到)
这个《合同陷阱》以文档的形式上传到了知识库中
他们的知识库是以工具的形式放在插件栏的,因为其实知识库本质上也是一个外部工具。
然后有点想吐槽他们这个智能体关联知识库的设计,我第一次用的时候找了半天都不知道怎么关联。
最后才发现原来是下图这样(要在智能体的「知识管理」里面先关联刚刚创建的法务知识库)
然后点击知识库问答插件的「设置」按钮
在像下图这样配置,可以选全部知识,按特定知识,按标签。非常灵活
怎么说呢,这个设计其实也没问题,主要是跟大家最开始使用智能体关联知识库的用户习惯不太一样。
而且它这个设计可以关联多知识库,或者只关联某个知识库的一小部分。
还挺灵活的。
添加完三个工具
我们的法务助手Agent就初步完成啦
第三步:实测
我找了一个之前签订的真实合同
然后丢给他,告诉它,我是乙方,让它分析一下合同
看一下效果。
执行过程大致是这样的:虽然咱们用的是DeepSeek V3,但是智能体也会思考,边思考边执行,它确实按照我预想的那样,先调用文档解析工具,解析合同内容。
然后调用知识库,获取合同陷阱资料,进一步检查合同是否存在隐蔽的陷阱。
最后调用「企业信息查询」工具,根据合同中甲方的信息(企业名称)搜索到了甲方详 细的信息,审查对方的资质。
卧槽,没想到这个合同最后检查出这么多问题!!
我当时就看了几遍,也找对方同步修改了一些细节,但是没想到还有这么多问题点。
特别是甲方居然还有这么多风险信息,这在之前我是完全不知道的...
以及针对它提出的问题和优化建议,我从新打开合同又看了一遍,发现说的完全没毛病
而且它知道我是乙方,但是也没有在建议里面偏袒我,而是本着公平公正的态度来回答,这一点挺好的。
体验下来,我感觉腾讯云智能体开发平台的多工具调用能力,还是非常稳的。
这里面加上企业查询的16个工具,一共有19个工具,数量不少了。
我换了好几个合同,测试了多次但是它能够每次都稳定选择正确的工具,按照提示词里面给的调用顺序,依次执行,稳定性还挺强的。
然后我又测试了一下当工具报错的时候,它会怎么办
上面是我人为制造的报错,我直接先在另外一个窗口把企业信息查询插件删除了,所以这里跑的时候调用不到。
可以看到报错之后,它没有崩溃,也没有退出,而是进行了智能回退。
回退到上一个步骤,然后重新换了一个工具调用,当换了好几个工具都不行时,也没有把系统报错暴露给用户,而是基于其他工具提供的信息给出了正常的回复。
用户基本上是无感的~
多工具调用能力横评
接下来我们把其他一些智能体平台加入进来横向对比一下多工具调用能力,主要是看稳定性。
参与横评的主要是其他我常用的一些智能体平台:Coze、Fastgpt、Dify
n8n就暂时先不加入战斗,毕竟它主要是工作流
为了尽量公平,我在Coze、Fastgpt、Dify上面也搭建AI法务助手,提示词和使用的工具都几乎一样,模型都选择了DeepSeek V3。
测试方案也比较简单,就是每个平台智能体分别都跑5次合同解析任务,看看准确调用3个工具(文件解析、企业信息查询、知识库检索)完成任务的成功率是多少。
虽然不是很专业的测法,但是也能一定程度上看出他们的能力区别。
首先是腾讯云智能体开发平台(请看VCR)
卧槽,5次都准确的调用了3个工具,完美的完成任务
成功率100%,稳定性超高
确实🐂🍺,本来我以为会有一些失败的。
而且上面这个视频完全没剪,一镜到底,只是我用的还是原版合同,所以在输出的时候有打码。
所以,为了后续不用费力去加马赛克,我把原版合同文件的重要信息改了一下,用来继续测试。
横评的所有视频都是一镜到底,只是做了加速处理。
第二个,我们一起康康Coze(非开源版)的多工具调用能力怎么样
Coze在5次中成功调用所有工具3次,其中有2次只调用了2个工具
所以Coze的多工具调用成功率是60%。
接下来到Fastgpt
fastgpt这里天然支持上传文件进行解析,并不需要文件解析工具,所以我给它接入了另外一个工具:markdown转文件。
并在提示词加了一条:7.最后使用markdown转文件工具,把结果转成文件供我下载。
可以看到,fastgpt在5次中仅有2次使用了3个工具。
所以本次fastgpt的多工具调用成功率是40%
最后到Dify
Dify虽然在工具市场里面能找到文件解析相关的插件,但是它的这个Agent里面竟然不支持文件上传...就很无语。
所以我不得不也给它换一个工具:Text To Speech(文本转语音)
并加了一条提示词:7.把最后给出的建议,使用Text To Speech工具转成语音。
然而Dify的表现令人费解,,,
先是框框输出英文,然后3个工具准确调用的成功率是0
最后直接就只输出一点点,就没了。感觉完全是一个乱飞的状态,可控性太差...
最终,本次测评腾讯云智能体开发平台完全胜出,是真滴稳。
但是有个缺点,就是执行太慢了,如果你的场景是要求非常快那种,腾讯云智能体开发平台暂时是不适合的。
但如果你的场景对时间不敏感,要求高成功率的话(比如医疗、金融、法务等等),那么直接闭眼选腾讯云智能体开发平台就行了。
我们刚才创建的法务助理是用的Multi-Agent(多Agent)嘛
那它肯定是支持多Agent协作的方式
接下来我们就一起康康,腾讯云智能体开发平台的多Agent能力怎么样
它的多Agent是分为主Agent和子Agent,就像人的一个小团队一样,不能没有leader,否则就容易乱,失去方向。
准备做一个房源资产文档化Agent(多Agent模式)
主要功能是:
房源的不同房间的图片,一键批量导入,生成房产归档pdf,支持pdf加密解密,图片自动编辑裁剪等。
适用场景:
房产中介:快速制作带看资料,提升客户展示体验
房东/业主:整理出租房源信息,方便租客查阅
开发商/物业:生成楼盘电子手册,便于营销推广
有三个Agent:
主Agent:房源资产文档化Agent(智能地把任务拆解,并决定先把任务交给哪个子Agent)
子Agent:房产生成Agent(图片转PDF,PDF加密)
子Agent:图片处理Agent(图片裁剪、扩图、AI清晰图片)
在主Agent的提示词里面把所有流程都规划好了,是一个Leader Agent
子Agent主要就是集成工具,完成工作
也可以点击添加Agent,继续添加更多子Agent
整个执行效果如下:
可以看到上面商品中主要发布了两个任务:
第一个任务是上传了两张房源照片,然后要求裁剪成4:3
第二个任务是上传了另外连个房间的照片,要求连同刚刚处理好的照片一起放到一个PDF中,并给这个PDF加密。
整个过程,Agent之间是自动转交、协同工作,很好的完成了任务,不需要写一行代码。
可以设置Agent转交关系,进一步让整个流程更稳定。
下图配置的是主Agent可以转交任务给两个子Agent,子Agent执行完转交回给主Agent决策。当然也可以自己根据需求设定子Agent转给另一个子Agent~
这种感觉就像你是一个老板,给几个员工布置了任务,他们自己就知道怎么分工合作,非常智能,也稳定。
然后我想继续,把多Agent能力也横测一下
但看了看,Fastgpt、Dify都没有这种类似的多Agent模式,最多就是能在工作流里面嵌入Agent,那也只是嵌入了Agent的工作流,跟多Agent不一样。
只有Coze有一个多Agents模式,但是也有点像工作流
我还是测试了一下(搭建了一个同样的多Agent),第一个问题测试效果,如下图右边(让裁剪一下图片)
裁剪完成后「点击查看」跳转的图片,怪怪的...
它把我的图片都要剪没了
然后第二个测试问题:把图片合并到一个PDF文件
试了好多次,它死活就是不调用处理PDF的Agent..
emmm,感觉Coze的多Agent模式不太ok
在这个多Agent还不成熟的阶段,我感觉腾讯云智能体开发平台的多Agent模式,确实值得一试,延续了多工具调用的优势,多Agent也能非常稳定的执行。
但我还是建议大家,那种追求高稳定的复杂场景使用工作流,毕竟基本上是百分百不会出错,但是搭建的门槛较高。
追求高稳定,但是场景、功能都不复杂,可以上腾讯云这个多Agent来处理。
以及多Agent模式也非常适合用于创造性的场景,比如头脑风暴,可以搞一堆名人Agent来组成你的智囊团(比如 爱因斯坦、亚里士多德、莎士比亚等等)。
又比如组建一个小开发团队,里面有前端Agent、后端Agent、测试Agent、设计Agent等等~
聊完Agent,我们再来看看另一个大家熟悉的功能:工作流(Workflow)。
在智能体领域,工作流并不是什么新玩意儿,它主打的就是一个稳定。
像n8n这样的老牌玩家,凭借其强大的节点编辑和逻辑编排能力,在自动化流程领域几乎是天花板级别的存在。而Coze和Dify也在工作流上持续发力,各有千秋。
但腾讯云智能体开发平台的工作流,还真有点不太一样。
我把腾讯云智能体开发平台的工作流和n8n做了个简单对比。
n8n的强大毋庸置疑,节点丰富,逻辑控制极其精细,非常适合搭建那种不需要用户过多干预、后台默默执行的复杂自动化任务。
但腾讯云智能体开发平台另辟蹊径,它的核心亮点在于,工作流里首创了一个具备全局视野的Agent节点。
这是什么意思呢?
你可以想象一下,传统工作流就像是固定线路的地铁,你只能从A站到B站,再到C站。
而腾讯云的工作流更像是一个经验丰富的出租车司机(也就是这个内置 Agent),他不仅知道预设的路线,还能根据乘客(用户)的实时对话,智能地决定是跳到D站,还是在B站稍作停留,甚至能理解乘客说算了,不去了然后直接结束行程。
看看下面这个视频就更好理解了
这种设计带来的好处是:不区分对话流和工作流、智能的节点跳转与回退
由于腾讯云智能体开发平台工作流独有的功能:能同时支持工作流和对话流,在工作流执行过程中,这个全局Agent会接管所有对话。
它能根据用户的实时意图,智能地在不同节点间跳转,而不需要你预先设定死板的if-else。
比如,一个收集订单信息的工作流,用户在输入地址时突然想修改商品数量,Agent能立刻理解并跳转回商品选择节点,这就是智能回退,整个过程非常丝滑。
它真正让工作流活起来了~
总的来说,腾讯云智能体开发平台的工作流并没有想去替代n8n这种老牌自动化工具。
它的定位非常清晰:做一个能与人高效、智能对话的流程引擎。
而这一点n8n、Coze、Dify、Fastgpt的工作流都完全不具备。
如果你的场景是那种需要和用户来回沟通、收集信息、处理异常的交互式任务(比如智能客服、预定助手、导购机器人),那么腾讯云这种内置了全局视野Agent的工作流模式,在保证流程稳定性的同时,又兼顾了对话的灵活性和智能程度,体验确实会好上不少。
Agent的标准模式->知识->高级设置里面有个Excel检索增强
说实话,对于表格数据,我之前一直都不推荐放到知识库,而是放到数据库。因为RAG的局限性,一些全局问题(比如统计全校男生有多少个)是无法准确回答的。
看到这个Excel检索增强之后,引起了我的好奇。
于是我先找到了一个Github高星项目数据分析表
数据不多,但表结构还算复杂,有多个sheet,每个sheet的表结构都不同。
然后创建一个标准模式的Agent。
在「知识管理」上传表格文件。
记得解析完毕要点击右上角「发布」
发布之后文档会变成已发布状态
并在知识的高级设置这里开启Excel检索增强
我们来测试一下效果。
先问一个全局问题,一共有多少个github项目
卧槽Σ(°ロ°),回答正确
再上点难度,星标数超过20万的项目有多少个?
居然又对了
于是我更好奇他们是怎么做的
点开参考来源一看我才发现
实际执行的时候用的是我在熟悉不过的sql语句,所以之前在上传Excel表格之后,腾讯云智能体开发平台应该是把Excel的数据提取并转成了数据库的表。
最终还是会通过数据库的存储Excel表数据,并让AI生成相应的sql语句来查询。
这样即便是上万行的表也不在话下了
可能这期发布之后,还是会有一些朋友在评论区问,跟一些开源平台比怎么样?
我想借用一下下面这位朋友的评论
真正用过企业级平台,才知道还是蛮不一样的。
深入体验之后我发现,腾讯云智能体开发平台有很多藏在表面下的细节,比如之前提到的知识库灵活匹配,多Agent的Agent转交关系配置等等。
还有非常多看到,但是还没来得及实际体验的细小功能,那些藏在水下的冰山,等待你去实际体验,挖掘。
「最后」
坦白说,在深度评测后,腾讯云智能体开发平台给了我不少惊喜。
它不是一个功能的简单堆砌,我能清晰地看到它背后对于企业级Agent的深刻思考。
无论是RAG,还是多工具调用,多Agent协同框架,以及带有全局视野Agent的工作流,都做的不错,能稳定保质的完成预期任务。
腾讯云智能体开发平台: 适合企业级严肃场景。
特别是对于那些希望将Agent深度集成到企业微信的企业来说,肯定是最佳选择。毕竟它跟微信、企微才是"一家人"。
好了,这期评测就到这里。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-04
大模型落地分层技术体系LLM
2025-08-04
个人知识库DeepSeekMine软件,处理100万字文档仅需2-3秒,最新安装包V2来了!
2025-08-04
AI 智能体如何改变软件测试
2025-08-04
基于大模型的领域场景开发:从单智能体到多智能体的React框架设计与实现
2025-08-04
【解决方案】将通用大模型“蒸馏”成行业专属小模型的三条落地路径
2025-08-04
大模型场景中 GPU 主流网络互联技术及性能评估
2025-08-04
聊聊React Agent的实现思路
2025-08-04
Sam Altman亲晒GPT-5实测问答,发布进入倒计时
2025-05-29
2025-05-23
2025-06-01
2025-05-07
2025-05-07
2025-05-07
2025-06-07
2025-06-21
2025-06-12
2025-05-20
2025-08-02
2025-08-02
2025-07-31
2025-07-31
2025-07-31
2025-07-30
2025-07-30
2025-07-30