免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


从零搭建AI客服!基于GPT-OSS和知识库的客户支持系统实战

发布日期:2025-09-01 17:35:42 浏览次数: 1543
作者:卓普云 AI Droplet

微信搜一搜,关注“卓普云 AI Droplet”

推荐语

用开源模型快速搭建AI客服系统,实战教程带你从零构建生物科技公司的智能客服。

核心内容:
1. 基于GPT-OSS开源模型在DigitalOcean平台的部署方法
2. 生物科技公司客户支持系统的知识库构建技巧
3. 敏感数据处理与客户服务场景的实战解决方案

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

Gpt-oss-120b 和 gpt-oss-20b 是 OpenAI 发布的两个开源推理模型。现在 DigitalOcean 的用户在 Gradient AI 平台创建 GPU Droplet 服务器时,可以直接调用 gpt-oss-20b 与 gpt-oss-120b。在本教程中,我们将演示如何在 DigitalOcean 的 Gradient™ AI 平台上使用 gpt-oss-120B 构建一个客户支持 AI Agent。

假设,我们将为一家虚构的、成立于 2027 年的生物技术公司 Mitofoundria 构建这个客户支持 AI Agent。Mitofoundria 是一家预防医学公司,生产个性化营养补充剂,帮助个体预防可能因遗传或环境因素而面临风险的健康问题。

这家虚构初创公司的网站迫切需要一个客户支持 AI Agent。

在 DigitalOcean 上使用知识库

不出所料,我们的客户支持的 AI Agent 需要基于真实信息来生成回答。知识库(Knowledge Bases)正是我们存储这些上下文信息的地方。请参考我们的知识库文档了解支持的文件格式,链接如下。

https://docs.digitalocean.com/products/gradient-ai-platform/how-to/create-manage-agent-knowledge-bases

数据方面的准备

请仔细考虑如何为你的客户支持 AI Agent 准备数据。以下是 Mitofoundria 所需数据的示例表格,你可以参考类似的格式或所需收集的内容等:

数据来源
需收集内容
重要预处理步骤
工单日志(Ticket Logs)
完整对话记录、标签(如“账单”、“物流”、“产品效果”、“副作用”、“基因数据问题”)、客户报告的症状
删除个人身份信息(PII),匿名化姓名和邮箱,屏蔽订单号,以及任何与基因或健康相关的个人信息
常见问题页面(FAQ pages)
现有的问答对或长篇文本,涵盖产品使用方法、科学依据、常见副作用、订阅管理等
确保每个问答对长度适中;若从长文本生成问答对,应将长文章拆分为简短片段(<150 个 token),每段独立成文并提供清晰回答;特别注意涉及健康声明和免责声明的内容
在线聊天记录(Live chat transcripts)
聚焦于产品咨询、补充剂定制、个人健康问题的客服与客户对话
隐去所有具体用户健康数据或基因标记;按主题分类(如“产品有效性”、“剂量问题”、“数据隐私”)
产品文档(Product Documentation)
补充剂的规格、成分、推荐剂量、禁忌症、科学白皮书等
按产品提取关键信息,包括每种补充剂所针对的特定基因标记或环境因素;创建结构化数据格式以便查询
科学文献与研究论文(Scientific Literature & Research Papers)
公开可用的科学论文、临床研究、学术文章,涉及补充剂成分及其对人体生物学和遗传学的影响
总结关键发现和结论;创建简洁、易于代理理解的摘要,用通俗语言解释复杂的科学概念;并与内部产品文档交叉引用

由于 Mitofoundria 是一家我们虚构出来的公司,上述数据将通过大语言模型(LLM)合成生成。我们使用了 Gemini 模型。以下是我们的提示词:






你的任务是为以下五个类别生成逼真的数据,确保每个条目都符合指定要求和预处理步骤。

1. 工单日志:

生成 10 条完整的客户支持对话记录。每条记录应包含完整对话、相关标签(如“账单”、“物流”、“产品效果”、“副作用”、“基因数据问题”)以及客户报告的症状。

预处理要求: 删除所有个人身份信息(PII),匿名化姓名和电子邮件,屏蔽订单号及任何基因或健康相关个人信息。

2. 常见问题页面:

创建 20 个问答对或长篇文本,内容涵盖产品使用方法、科学依据、常见副作用、订阅管理等。

预处理要求: 确保每个问答对长度合理;若从长文本生成,请将其拆分为“简短片段”(少于 150 个 token),每段独立且回答明确。

3. 在线聊天记录:

生成 10 段不同的客服与客户对话,聚焦于产品咨询、补充剂定制、个人健康担忧等。

预处理要求: 隐去任何具体的用户健康数据或基因标记;按主题分类(如“产品有效性”、“剂量问题”、“数据隐私”)。

4. 产品文档:

为三种不同的虚构 Mitofoundria 补充剂生成关键信息,包括成分、推荐剂量、禁忌症,并说明每种补充剂所针对的基因标记或环境因素。

预处理要求: 以结构化、易于查询的格式呈现信息。

5. 科学文献与研究论文:

为五篇不同的公开科学论文或临床研究创建简明摘要,内容涉及补充剂成分及其对人体生物学和遗传学的影响。

预处理要求: 总结关键发现和结论;创建“代理友好型”摘要,用简单语言解释复杂科学概念;并与之前生成的内部产品文档进行交叉引用。


实现客户支持 AI Agent 的两种方式

有两种方式可以实现我们的客户支持 AI Agent:

  • 使用 DigitalOcean API
  • 使用控制面板,也就是通过浏览器页面登录DigitalOcean的后台(Control Panel)


API 允许你直接通过代码的方式实现 AI Agent,而控制面板则提供了无代码操作界面。

使用 DigitalOcean API 创建 AI Agent

首先创建一个**个人访问令牌(Personal Access Token)**。获取令牌后,将其粘贴到以下 curl 命令中,并根据你的客户支持 AI Agent 需求配置其他参数。注意:如果你还没有知识库,可能需要先创建一个。

curl -X POST \    -H "Content-Type: application/json"  \    -H "Authorization: Bearer $DIGITALOCEAN_TOKEN" \    "https://api.digitalocean.com/v2/gen-ai/agents" \    -d '{      "name": "Mitofoundria Customer Support Agent",      "model_uuid": "95ea6652-75ed-11ef-bf8f-4e013e2ddde4",      "instruction": "你是 Mitofoundria 的友好且专业的客户支持代理,这是一家预防医学公司。你的目标是帮助客户解答有关个性化补充剂、订阅管理以及科学基础的问题。请使用提供的知识库准确、简洁地回答问题,保持专业且富有同理心的语气。",      "description": "Mitofoundria 的客户支持代理,该公司专注于个性化预防性营养补充剂。",      "project_id": "YOUR_PROJECT_ID",      "tags": [        "mitofoundria",        "customer-support",        "preventative-medicine"      ],      "region": "tor1",      "knowledge_base_uuid": [        "YOUR_KNOWLEDGE_BASE_UUID"      ]    }'

使用 UI 部署 GPT-OSS

步骤 0:登录 DigitalOcean 账户

还没有 DigitalOcean 账户?别担心,访问DigitalOcean.com可以进行注册,只需填写邮箱,绑定信用卡或支付宝或Paypal即可。如果注册遇到问题,可以询问 DigitalOcean 中国区独家战略合作伙伴卓普云aidroplet.com,你还可以与卓普云详细沟通你的需求,辅助你进行技术选型。

步骤 1:创建项目

登录后,创建一个新项目。


步骤 2:进入代理平台

通过点击 DigitalOcean 控制面板中下方圈出的图标进入代理平台。


步骤 3:选择知识库

选择一个已有知识库;如果没有,可以创建一个新的。

创建知识库时需要提供数据源。你可以添加多个数据源,支持的格式包括:

  • 文件上传
  • URL(用于网页抓取)
  • Spaces 存储桶或 Amazon S3 存储桶中的数据

上传文件时,单个文件不得超过 2GB,每次上传不超过 100 个文件。你还需选择一个嵌入模型(embedding model)。请注意,知识库需要一定时间进行索引——通常需要约五分钟或更长时间,系统会在此期间处理、嵌入并存储你的数据。

步骤 4:指定工作区(Workspace)

工作区将相关的代理归入同一空间,便于管理、团队共享和结构化性能评估。所有代理必须属于某个工作区。创建代理时可指定其所属工作区,之后也可自由移动。


步骤 5:在 Playground 中测试代理

代理部署完成后,使用 Playground 进行测试。提出问题并评估其回答,确保其按预期运行。



步骤 6:使用测试用例评估代理性能

在 Gradient 平台上,你可以创建“评估测试用例”。通过创建包含一组提示词的数据集,并在代理上运行评估,即可测试其表现。运行完成后,你可以查看结果,包括各项指标得分以及代理对每个提示的回答详情。

步骤 7:管理代理端点(Endpoint)

代理创建后会自动生成端点(Endpoint),即你可以集成到应用中的 URL。你可以通过该端点发送文本请求,并接收 JSON 格式的响应。此外,还可以通过端点自定义请求设置,例如最大生成 token 数、检索信息的处理方式等。

结论

在本教程中,借助 DigitalOcean 的 Gradient AI 平台,你不仅仅是在构建一个聊天机器人——而是在打造一个真正理解客户的客户支持 AI Agent。通过将回答建立在你自己的数据基础上,你可以获得更准确、更相关的结果。无论你选择使用 API 还是无代码 UI,最终都能实现:更快、更智能的客户支持,并随业务增长而灵活扩展

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询