支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


淘天⾃营质量技术AI智能体的实践和思考

发布日期:2025-05-19 17:43:24 浏览次数: 1549 作者:大淘宝技术
推荐语

探索AI技术在自营领域的创新应用,应对业务链路复杂性与场景多样性的技术挑战。

核心内容:
1. AI智能体在自营技术领域的应用背景与挑战
2. AI智能体的整体架构设计与核心能力
3. AI智能体的具体实施方案与应用效果展望

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家



本文介绍了“自营质量技术AI智能体”的实践与思考,探讨了如何通过AI技术解决自营领域业务链路复杂、场景繁多带来的技术痛点。文章详细阐述了AI智能体的整体架构设计、核心能力(如工具调度、数据查找、链路诊断等)、具体实施方案及其应用效果,并展望了未来在AI赋能质量技术领域的规划与发展方向

图片



关于⾃营技,业务域覆盖了C(猫超交营销&导购直播&⽤户)B供应链流履计费等核务领域,且分出众多务⼦域些⼦域围绕务质量保障体各⾃特性呈现出显著的差异化务链路冗⻓,业场景繁杂致使技⼈员⽇常⼯作中⾼频⾯临诸多⼿痛点:不务背,不知该如何操作,不什么⼯具,不会⽤⼯具,不构造测试数 据异常排时等等



随着AI模型猛发展具备⾜够的""可以相对"低成"去解决⼯作中的各问题的能⼒我们看到了为务技同学⽇常⼯作提效的可能性



图片

务 AI试助理⻆⾊即质量技术 AI能体的想法油然⽽⽣我们期望它成为技解决⽇常问题的得⼒助⼿有系统功能问题找 AI数据诉找 AI⼯具诉找 AI的⾼效⼯氛围

点问题


⼀个全链路项⽬中可能会20术团系统链路⻓,不务域的场景差异较⼤⼯具平台种类繁⼯具分散规则复⼈⼯⽅式\调度⼯具具有较⼤的理解和使⽤

  1. AI+⽅向⾯对务特性如何能够⼊⼝沉淀⽤能⼒赋能到开发产品同学

  2. 解决是私域问题减少模型环境和可解释性更稳&


  3. AI能体如何具备可代扩展可低成接⼊和运维可复⽤的系统能⼒


  1. 抽象⽤能⼒务域可使⽤),优先完成⽤能⼒Agent建设解决领域特有场

  2. 沉淀解决⽅和实施链路成可复⽤的试解决⽅案框架减少⼤家AI实践由于踩产⽣的沉默


提出基流程任务排引擎+RAG的解决⽅流程任务排引擎作为系统模型之间的交互桥梁承担执⾏层的能⼒


任务能⼒划分


  • 静态数据通过知识库理 --⽤于⼤模型交互\识别\任务推理


  • 动态数据\配置或任务通过流程任务引擎  --⽤于场景配置化接⼊模型外界系统交互的执⾏媒介



图片


基于流程任务排引擎+RAG架构开发直领域场景agent实现集⼯具⼯具调度数据查找数据⽇志\链路\异常诊断扩展Agent体的⾃营质量技AI能体



整体⽅案架构图



  



  1. RAG架构选型采⽤的是淘AiStudio平台⽀持快搭建⼀个快捷定的RAG系统

  2. 通过动态任务配置模块⽀持场景配置化快接⼊⽆需开发⽆需调优

  3. 通过流程编排任务引擎⾏领域交互解耦拆解⽤户任务提供灵定制化的RAG


  1. 当⽤户⼊问题通过定制化拆分多"检索增强⽣成"⼦任务完成⼀个agent功能



  流程任编排擎能



通过动态配置模型⽀持对任务&调度能⼒任务之间具备上下具备流程任务编排调度能

  1. 任务⽀持任务调度修改重试功能便于排调度过程提⾼复杂场景调度定性

  2. 多协议接⼊⽀持HSFHTTPBEANTHUB种通⽤或平台协议快接⼊原⼦务能

  3. 动态配置⽀持⼯具配置参数模板配置数据中⼼基础信息配置链路诊断配置



图片



  Agent



解决⽤户对⼯具诉的意找⼯具⼯具⽤\执⾏⼯具


  • 详细设计


常⻅有2种接⼊⽅式,⽅案1⽆法做到通⽤,本⽂重点介绍⽅案2的实现。

1将⼯具通过httphsf协议配置到Ai  Studio平台通过⼤模function_call


  • 限制

  • 配置繁新增删除⼯具需增加提需要发布agentfunctionCall模型⽀持

  • ⼯具的调⽤完全依赖模型的推理能⼒保证

  • ⼯具太多幻觉⼤难以控

  • 调度法进⾏⽇常


  • 应⽤务⼦域可参考⼦域的单⼯


2通过RAG+function_call调流程任


1.⼯具特征知识库设计结构化⼯具介使⽤说参数说明等结构


a.可考虑结构json式展


2.切⽚控制单⼯具信息切⽚⼀个chunk


3.通过双路召基于语义向量和关键字⾏知识召


4.词⼯和⼤模型选型调优


5.回流程任务引擎据⼤模型输流程任务并⾏调度

详细系统流程下:


  • ⽅案优势



  1. 结果稳为⼯具数量增多导致出现幻觉或定调


  2. 于调优幻觉常出现语义相似⼯具之间通过优化知识库⼯具特征增加⽤户问题的提词可减少幻觉


  3. 可扩展针对⼯具增加认参数模板trace⾃定义结构等扩展能


  4. 多协议仅⽀持httphsf协议的调⽤⽀持thub数据源等⽅式


  5. 可异针对⼯具执⾏间⻓的场景可异执⾏返回



  • 场景接⼊


⽀持httphsfthub种通\平台协议的⼯具配置化接


接⼊意事项


注意⼯具语义描述,⼯具的基础信息能够准确⽀持⽤户查找、使⽤他的所有场景,并且能够区别其他相似⼯具。


  • 效果与演示


具答


具使⽤提



具调



  数据查agent



解决⼤家总是有找供应找指定品的信息找指定供应账号密码......


静态数据查找可通过答疑agent实现,该agent主要实现动态数据查找


  • 详细设计⽅案


同于⼯具agent数据静态的知识库RAG可实现动态的⾏数据。整体可以⽤户诉抽象成以下两个


1.查资


a.资料从


i.


ii.数据ADBODPS


2.⼤模总结


a.场景如何定制化回答 ---动态prompt实现

详细系统流程



  • 案优



1.动态RAG链路接⼊成调试后仅需配置化接


2.⽀持灵流程任务配置流程场景



  • 如何



1.数据源查找⽅式⽀持配置化接⼊参考⽂


2.接⼝找⽅式如需定制化prompt需动态调试调试⽅参考⽂



  • &




⽬前已接⼊全链路品数据动态试数据找供应相关信息规则询诊订单特征场景



找全链路数据odps



找指定供应



指定交订单特



查商区域否可



  链路诊断Agent



通过对关键字问题⾏链路数据⽇志找获取相关信息后由⼤模型进⾏分


  • 详细设计




1.数据


a.链路数据依赖阿拉链路诊断和眼数


b.⽇志诊断依赖集⽇志运维


2.任务拆分据⽤户指定拆分找链路任务or找⽇志任


a.⽇志找任务⽀持多种维度数据筛查⽬的为了准捞取⽬⽇志去除⽆⽤⽇志减少⼲


i.关键字筛选


ii.配置询⽇志必要字


iii.⽀持动态前置过滤和排除的则规


3.动态prompt⾏异常诊断⽇志分析等定制化任

4.后扩展询异常的git提交信息详细系统流程


详细系统流程

  • ⽅案优势


1.⽀持多种维度规则配置控制捞取准确的⽬


2.⽀持链路巡⽇志巡链路+⽇志巡


3.⽀持同数据


4.⽀持后能⼒扩展代码



  • &



⽬前mmc应⽤已接⼊⽀持相关应⽤的链路和⽇志异常诊断演示:


演示:



  答疑Agent



基于知识库⾏兜底



  • 实现⽅案


通过对知识⽂向量库的据⽤户问题对相关⽂档进⾏召模型交互答案和参考⽂献


  1. 知识库⽂档构将⼤家⼼的试⽂档通过AI准化为知识谱的⽅式提⾼⽂的召准确度

  2. 基于语义向量和关键字的知识相关的topN


  3. 定制化域⼤模型交互的prompt通过模型选型prompt调优得到结果



  • 果展



 

图片
AI



⾃营技质量AI能体经过能⼒的代的发展⽬前处于功能优化&推⼴试⽤阶


当前


  • 100+同学提供过服及开发产品


  • 使⽤8k+

  • 其中数据查找⼯具调⽤项⽬提效效果明


  • 链路诊断⽀持系统异常分⽬前仅务接⼊待推


  • ⽀持其他⽇常

随着测试语料库的持和新增AI质量技术智能体⽀持解决问题的能⼒也会新增过程,如何持调整优化保障定性和准确性的挑战



图片
总结


合成未来确定性合⼯+RAG+MCP建质量技术智能体解决域复场景可⾏的⽅向


当前


已初建成具备多务能⼒的质量技AI能体能够开发产品同学⽇常知识库数据构造数据问题排提供效的帮助


⼼功能覆盖


  1. 能⼯具调度实现⼯具的能咨询调度能

  2. 数据⽀持跨系统检索关联分

  3. 务链路诊断提供基于关键字溯源链路⽇志的能

  4. 知识库疑知识库通过AI准化知识提供疑能⼒

未来


  1. 能⼒完⾃营质量技AI能体模块agent的能⼒造测开发产品AI试助⼿

  2. 案沉淀未来AI完成试分试执⾏的愿提供⽅建设和沉淀原⼦能⼒形成可复⽤的试解决⽅案框架

  3. ⽣态共建挖掘场景agent推动⼤家参考相关⽅系统能⼒并能够场景

  4. 场景虑通过推理模型解决复杂场景


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询