支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI实现智能客服第4节:开源N8N编排采集同城旅行网数据知识

发布日期:2025-06-12 13:52:52 浏览次数: 1562
作者:无处不在的技术

微信搜一搜,关注“无处不在的技术”

推荐语

开源N8N工具助力AI客服知识库搭建,无需编程即可实现同城旅行网景点数据自动化采集与处理。

核心内容:
1. 基于N8N实现景点数据自动化采集的完整流程
2. AI大模型在数据清洗与格式标准化中的应用
3. FastGPT知识库对接与智能客服问答系统构建

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

持续内容输出,点击蓝字关注我吧

01




前言



来看一段AI大模型对它的介绍

在上一篇文章中,我分享了AI客服知识问答中关键的RAG的知识, 同时介绍了FastGPT的界面实现RAG的流程。

本节我将分享实现AI客服第一步需要做的内容:数据准备与知识清理入库。

之前的分享中,基于同城旅行网的FAQ数据实现了基于常见问题的AI客服问答的玩法,与问题分类的设计处理。本节我们实现一个基于同城旅行网的景点业务线的知识问答,形成一个支持景点数据知识的AI大模型客服。

首先我先说下本节需求:

本节计划继续基于同城旅行网的景点数据,通过N8N这个编排工具实现景点数据自动化流程处理,然后将获取到的知识存储到FastGPT中,避免通过写程序的方式获取数据,充分利用AI大模型的推理和总结,生成符合标准格式的知识数据,从而实现基于景点数据的AI客服问答。

本节流程如下:

再来看看本节最终解析到的景点数据格式:

这个数据整理就是通过AI整理的数据,格式非常清晰。


02




N8N环境搭建




搭建之前,先来简单介绍下N8N。

N8N是一个具有原生AI功能的开源工作流自动化平台,凭借 可视化构建 + 代码扩展 的独特设计,截至2025年5月27日,目前Star的数量为99K。如下所示:

N8N的发展历程也很不错:

它为技术团队提供了代码的灵活性和无代码的速度。尤其在AI大模型时代,很多时候对于创新性的AI落地场景,我们没必要写代码,可以通过转变思维,借助开源工具流程编排实现某些业务的可视化设计,提高效率。

N8N有400多种工具和能力集成,对于我们日常场景的基本都能覆盖。

相关的参考文档如下:

github : https://github.com/n8n-io/n8n

官网:https://n8n.io/

?文档: https://docs.n8n.io/

? 400+集成: https://n8n.io/integrations

? 工作流程示例: https://n8n.io/workflows

? AI与区块链指南: https://docs.n8n.io/langchain/

? 社区论坛: https://community.n8n.io/

几个核心能力如下:

可视化拖拽构建:连接 400+ 应用节点,支持条件分支/错误重试多步 AI 代理:基于 LangChain 构建复杂 AI 工作流私有化部署:Docker 一键部署,支持完全离线环境代码嵌入:随时插入 JavaScript/Python 代码段
调试利器:单步重试/数据模拟/实时日志追踪
企业级安全:SSO/RBAC/审计日志/加密存储模板市场:1200+ 现成工作流模板开箱即用MCP能力支持:支持对接MCP Server

我们可以通过配置,实现如下这种复杂的企业级别的AI工作流或者任务处理:


安装的过程也非常简单,只需要具备Docker环境即可,有了Docker环境,我们可以参考Gtihub主页上的安装方式处理,执行如下命令安装N8N

docker volume create n8n_datadocker run -it --rm --name n8n -p 5678:5678 -v n8n_data:/home/node/.n8n docker.n8n.io/n8nio/n8n

通过如上命令,我们就可以拉取并创建一个N8N的容器服务,部署完成后,浏览器访问如下地址。

http://localhost:5678

首次访问会提示注册用户,我们注册即可。登录后进入到首页如下所示:


03




N8N同程旅行网采集




首先,我们看下我们的最终的流程编排效果:

这里我定义了4个节点:

节点1:定义一个Webhook节点,接收外部数据,相当于定义了个Controller。

节点2:是一个HTTP请求节点,这里我用它实现同城旅行网景点数据的获取。

节点3:是一个AI节点,负责解析网页HTML中的数据和推理

节点4:也是一个HTTP请求节点,负责的是将AI返回的数据,写入到FastGPT知识库中。

首先我们在主界面选择Create Workflow,创建工作流,进入编辑界面:


然后选择右侧的加号,添加一个Webhook节点,如下所示:

接下来会进入到节点编辑界面:

这里,其实相当于定义一个Webhook接口,同时对外暴露测试或者生产的地址。这个页面我们基本不需要动,选择上方的Back to cavas回到编辑页点击测试工作流:

就可以开启工作流的启动:

然后我们在Postman中访问该地址:

然后再N8N中可以看到结果:

接下来我们做第2个节点,我们首先看下同程旅行网的景点数据,比如我们访问如下网页:

https://www.ly.com/scenery/BookSceneryTicket_32291.html

我们鼠标右键查看源代码,看看这些景点名称和级别都在什么位置标签中:

通过这样的分析后,我们就知道了,我们需要的数据这种HTML标签中了。

然后,我们可以先启动下测试工作流,再通过Postman发送一个包含url参数的请求。有了这个请求后,我们开始配置第2个节点。

在第一个节点的基础之上创建第2个节点:

设置如下内容:

这里可以手动写表达式,也可以拖动左侧的JSON节点到URL编辑区,这样第2个节点配置完成。

继续添加第3个节点,这里我选择的是OpenAI节点,虽然没有OpenAI账号,但是我们有OneAPI,可以通过它包装为一个OpenAI格式的服务,这里也可以选择Ollama,也是支持的。

在AI节点中,我们选择如下,这里如果是第一次添加会让你选择OpenAI的认证授权信息,填写一下API地址和密钥即可:

然后我们把上一步的data数据,也就是网页的HTML数据拖动到用户提示词中:

然后设置下方的system提示词如下所示:

## 角色你是一个HTML网页内容提取和分析专家,能够根据用户提供的网页的HTML内容提取出来相关景点的核心介绍、景点等级、景点说明等内容。## 提取规则1、提取当前HTML网页中的TITLE名称中的景点信息标题2、请根据用户提供的同程旅行网的HTML内容,从<BODY>标签中提取出景点名称,景点级别等景点信息3、景点名称在class="s_name"元素中,以及class='s_des'中的简介,以及class="s_com s_address"元素中的景点地址4、<div class="inf-f-con"元素中的景点介绍,如果inf-f-con中包含图片地址,请用Markdown的图片格式返回,尽可能保持原文的顺序结构。5、class="tra_line"元素中的停车信息、公共交通信息、地址等信息6、根据提取到的内容,优化为一篇景点介绍文章,自动对Markdown结果进行换行格式化,不要出现\n,以便生成的结果我能够直接使用。7、返回结果需要使用Markdown格式,返回内容即可。## 返回格式### 景点介绍**景点名称**: **景点级别**:**景点简介与图文与经典特色****景点地址**:**交通信息**:

这样我们的AI节点完成,我们在调试下,可以看到效果如下所示,成功解析到了数据:

有了这个数据后,我们在开发一个FastGPT的节点,写入知识数据,这里我们在添加一个HTTP请求节点,然后看下官方文档关于FastGPT Open API的接口说明:

通过接口文档可以知道,我们只需要创建这样一个JSON发送请求即可,接下来在FastGPT中,创建一个访问的Key:

然后创建个知识库:

单击进入到知识库中,可以获取到知识库ID:

创建好知识库以后,我们可以先构造一个请求的JSON:

如果Postman测试没问题,可以成功写入数据到FastGPT中,那么在HTTP节点中,设置URL:

在设置请求头:

在设置请求体Body,其中text字段为:解析到的网页内容,来源于上个节点:

继续设置其他参数,这里的文件名称我选择了第一个节点的Webhook的请求参数中的URL:

这样一个流程编排完成,接下来再启动流程,然后我们通过Postman触发这个流程,流程正在执行中:

执行完成,就可以成功写入到知识库中:

景点数据如下:

有了这个数据后,我们在之前的客服工作流中,添加这个知识库和分类:

测试效果如下:

可以看到这样,基于我们的私域的一个同程旅行网的AI景点客服就完成了。

通过N8N+FastGPT实现了知识的采集、整理、入库、提问。效率非常有提升。

感兴趣的可以一起交流和动手哦。

再来分享下N8N的优势:

优势一:

  • 开源免费,数据主权完全自主完全开源
    代码在 GitHub 完全公开,可通过 Docker 私有化部署在企业内网,敏感数据零泄露风险,金融、医疗等合规场景必备。
  • 零成本门槛
    自托管无任何费用。

优势二:

  • 400 + 节点,集成能力碾压级存在万物互联
    支持从传统数据库(MySQL、PostgreSQL)到云端服务(AWS S3、Google Sheets),甚至硬件设备(Arduino),真正实现 “跨系统数据同步 + 业务流程自动化”。
  • 实战案例
    某跨境电商用 n8n 连接 Shopify 订单、物流 API、金蝶 ERP,自动完成 “订单创建→库存扣减→物流单号回传→财务记账” 全流程,人工干预减少 80%,月均节省 300 + 小时。

优势三:

  • 代码 + 可视化双引擎,适配所有用户非技术用户
    通过拖拽 “HTTP 请求”“邮件通知”“数据过滤” 等节点,轻松搭建 “表单提交→审批流程→数据存档” 等基础工作流。
  • 开发者友好
    用 JavaScript/Python 节点编写自定义逻辑(如数据加密、复杂算法),甚至接入自有微服务,某科技公司用 n8n 实现 “用户行为数据→AI 模型分析→个性化推荐接口” 实时联动,开发周期缩短 60%。
  • 劣势
    学习门槛较高,需理解 API 概念和工作流逻辑。
04




总结





本文分享了使用开源的编排N8N工具,实现网页数据的抓取,然后通过FastGTP的API,实现景点数据的抓取入库,从而实现了基于同程旅行网的AI景点客服功能。通过这种N8N工作流自动化可以帮助组织减少人为错误,也可以释放员工的时间,让他们专注于更有价值的工作。

想要了解的更多N8N的使用信息,可以看看B站上的一些视频操作:

1、https://www.bilibili.com/video/BV1QdEezmEEK/

2、https://www.bilibili.com/video/BV14cPTecEwd/

3、https://baijiahao.baidu.com/s?id=1816380678045290591&wfr=spider&for=pc

4、https://zhuanlan.zhihu.com/p/1899890553686066541

5、https://www.bilibili.com/list/ml3492028540

6、n8n、dify、Coze 深度测评:从 0 到 1 选对 AI 自动化平台,避开 99% 的坑:

https://www.woshipm.com/ai/6205201.html

7、保姆级教程:用n8n打造一个24小时监控AI博主的工作流

https://www.woshipm.com/ai/6212281.html

喜欢本篇文章的,感兴趣的小伙伴可以一起交流沟通哦。


最近也看到有人问如何学习AI,这里分享几个资料如下:


1、通往AGI之路的知识库飞书云文档:

https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e

2、掘金的AI知识库的飞书云文档

https://agijuejin.feishu.cn/wiki/UvJPwhfkiitMzhkhEfycUnS9nAm?table=blk3RfZtR7Nh73tO

3、极客时间的AI知识库的飞书云文档

https://geek-agi.feishu.cn/wiki/B9rYwwg6xidZYJkbrlscxTQFnOc

4、LangGPT社区的飞书云文档(结构化提示词等等):

https://langgptai.feishu.cn/wiki/RXdbwRyASiShtDky381ciwFEnpe

5、一站式AI产品经理飞书知识库:

https://v11enp9ok1h.feishu.cn/wiki/KiIvwdFOciiqqNkwKzTcmn88ndL

喜欢本文的,可以关注、收藏、点赞、转发、分享到朋友圈哦。

本专题系列文章:

AI实现智能客服第1节:基于FastGPT知识库的AI客服搭建与使用

AI实现智能客服第2节:借助RAG实现常见问题的同程旅行AI客服

AI实现智能客服第3节:AI客服的核心能力RAG介绍

- END -

喜欢的可以加入我的免费知识星球:觉醒的新世界程序员,随时与我沟通,交流技术与想法。目前星球内正在更新AI代码评审的设计与实现,AI客服系统的搭建,也会定期的分享技术资料。

喜欢就点个 在看 呗 ?

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询