免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


手把手教程!打造可以上岗的企业级Agent

发布日期:2025-08-26 18:50:18 浏览次数: 1537
作者:讯飞开放平台

微信搜一搜,关注“讯飞开放平台”

推荐语

打造企业级AI助手不再是难题!三步流程让Agent快速胜任岗位,提升团队效率。

核心内容:
1. Agent上岗前的全面能力测评方法与工具
2. 结合人工与智能的混合测评策略详解
3. 自定义评估维度的配置技巧与实际应用案例

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

今年秋招,我们迎来了一位特别的新同事小辰——知识丰富、说话风格随心切换,能像资深顾问一样答技术问题,也能像运营同事一样聊活动规则。

TA的工作内容,是随时为开发者解答“讯飞星辰Agent开发平台”相关的问题。

以前,开发者问:“怎么接入星辰API?”“团队空间权限怎么设?”“Agentic RAG怎么用?”得费时费力查好几份文档,现在新同事小辰几秒就能答全,还能教你一步步做。

聪明如你,也许已经猜到了小辰的真身——由星辰Agent平台打造的“官方助手”

但让这样一位AI同事胜任岗位,并不是“喂个知识库”那么简单。我们让它经历了三步上岗流程——测评、培训、协作。

01

能力测评,属于Agent的“入职考试”

真正上线前,我们首先用星辰Agent平台的Agent效果测评功能,对小辰做了全面测试。随后,借助多维量化评估体系(准确性、人设一致性、逻辑性等)自定义维度评估(如“最新规则响应率”“复杂问题分解能力”等),精准找到了不足之处。

结果很直观:系统生成可视化报告,哪里答得好、哪里需要优化,一目了然。经过几轮调优,小辰的岗位适配度显著提升。

具体操作步骤如下:

1.1 新建测评任务

打开星辰Agent平台,进入个人空间-效果测评】,新建【测评任务】,选择你要测评的智能体,创建测评集测评集可由“平台常见问答”“多步骤配置”“最新规则应用”等高频问答任务组成。

创建测评集

测评集是评估智能体能力的核心依据,它决定了测试是否全面覆盖Agent的关键工作场景,并直接影响测评结果的准确性与参考价值。

1.2 选择测评方式

为了让智能体在不同业务场景中都能获得精准、全面的能力评估,星辰Agent平台提供三种测评方式,用户可根据Agent的功能特点与应用需求灵活选择:




智能测评:针对信息准确性、逻辑完整度等可量化指标,可实现快速批量评估,大幅提升测评效率。

人工测评:适用于隐含语境、品牌调性等主观性较强的场景,由人工逐项细致打分,确保评估结果更贴近真实需求。

一键并行:融合人工与智能测评的优势,协同完成评估,既保留了人工的深度灵活,又兼顾了智能的速度与规模。
选择测评方式

在智能测评模式中,平台内置擅长推理与问答的DeepSeek-V3讯飞星火X1作为裁判模型,帮助用户快速、精准地测评智能体的问答表现,让测评结果更具参考价值。

1.3 配置测评维度

测评维度决定了评估的深度与方向,是衡量智能体能力的核心依据。

除了平台官方预置的回复准确性、人设一致性、对话流畅性、回复多样性、对话逻辑性等通用指标,用户还可以根据业务需求灵活添加自定义维度,例如“最新规则响应率”“复杂问题分解能力”等。

这样不仅能精准捕捉小辰在新规适配、多轮推理等关键能力上的表现,也能让测评结果更贴合实际使用场景,具有更高的参考价值。

配置测评维度

最后批量运行所有用例后,系统自动生成详细报告,可视化展示智能体表现不足的场景,帮助我们精准调优Prompt与知识库。

这就像新同事试用期答辩一样,效果测评帮我们量化了AI的岗位适配度,也让改进方向一目了然。

02

进阶培训,让Agent自主解决复杂问题

小辰能够做的不仅是简单的“查字典”,还能够解决综合性、多步骤的复杂问题,比如:“我想在团队空间里创建一个带有Agentic RAG能力的智能体,需要哪些权限、怎么配置知识库?”

传统RAG单次检索后可能只给出模糊答案,在Agentic RAG加持下,小辰则会:




拆解问题;
检索内部文档、FAQ、外部知识源;
整合成清晰可执行的步骤;

这意味着,即便问题跨多个文档、需要多步推理,它也能一步步带你完成。

基于传统RAG构建的星辰客服助手

基于Agentic RAG构建的星辰客服助手

相比传统RAG,Agentic RAG的优势在于:




动态多轮检索:初次检索不充分时,通过反思与规划自动追加检索,避免答案片面或错误。

智能检索决策:Agent根据问题语义选择最合适的外部知识源或工具,而非依赖单一向量库。


多知识源融合:支持内部数据库、网络搜索、API等多种数据源,灵活整合信息。


上下文关联推理:能跨文档片段捕捉深层语义与逻辑关系,适合多跳推理问题。

简单来说,传统RAG就像在图书馆找资料,能不能回答问题取决于馆内库存;而Agentic RAG更像拥有一部智能手机,不仅能搜索网络,还能调用浏览器、计算器、邮箱、聊天记录等多种工具,把问题一步步解决。

03

团队协作,推动Agent随业务迭代升级

FAQ是动态更新的,新的功能、规则、案例随时都会出现。通过团队空间,我们的产品经理、技术支持、运营同事,都能直接参与小辰的“成长”:

  • 产品团队更新新功能说明

  • 技术支持补充配置细节

  • 运营同步最新活动规则

所有改进都在同一个AI实例中完成,这样,不管是开发者还是内部同事,接触到的企业知识永远是最新、统一、准确的版本

星辰Agent平台为企业版用户提供无限容量的共享空间,满足多角色、多团队共享与编辑企业数字资产的需求,提供高效便捷的知识协作体验。

企业版空间管理

如果想让小辰这类智能助手的交互更加丰富,还可以为Agent添加语音识别超拟人语音合成插件——借助讯飞在语音技术上的国际领先能力,让用户可以用自然对话发起咨询,并获得流畅、逼真的回复。

星辰Agent平台提供丰富的工具拓展能力

这让小辰更像一个真正的同事,而不仅仅是文字里的助手。

这次“小辰上岗实录”,也印证了一个事实——企业想让Agent真正融入业务,需要走好这三个关键步骤:




能力测评 —— 用好Agent效果测评,验证AI是否具备胜任岗位的基础能力;
进阶培训 —— 借助Agentic RAG,让AI学会解决企业特有的复杂问题;
团队共建 —— 通过团队空间,让AI能随业务变化持续迭代升级。

依托这一流程,讯飞星辰Agent开发平台正在帮助企业将AI从“能对话”升级为“能办事”。无论是客服、质检还是生产调度平台都能为你的Agent提供从考核、培训到协作的全流程支持,让每一个智能体都能顺利上岗、稳定执行、持续进化

欢迎进入星辰Agent开发平台,定制你的企业级Agent员工!

文末互动

分享你让AI员工顺利上岗的经历与体会

评论区抽三位用户送星辰Agent月卡

(截止时间8月31日18:00)

往期回顾

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询