免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Aiops探索:基于 Dify + Prometheus MCP 的运维智能体实践

发布日期:2025-11-21 17:18:29 浏览次数: 1512
作者:阿铭linux

微信搜一搜,关注“阿铭linux”

推荐语

探索如何用自然语言轻松查询监控指标,Dify + Prometheus MCP 实现智能运维新方式!

核心内容:
1. 基于Dify和Prometheus MCP构建运维智能体的技术架构
2. 详细部署Prometheus MCP Server的步骤与配置要点
3. 在Dify平台集成MCP工具实现自然语言查询监控指标

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

研究Aiops有一段时间了,目前手里有不少可落地的方案了,接下来会把这些方案全部整理到我的大模型课程里。同时,欢迎大家把你遇到的场景在评论区留言。我会在能力范围内给你提供思路和建议。

今天的案例是基于dify和Prometheus MCP做一个针对Prometheus的运维智能体。我们最终的目的是为了实现,通过自然语言来查询各个监控指标数据。比如,我想知道最近1小时CPU的使用情况,是否异常,我可以这样问智能体:帮我分析一下集群最近 1 小时 CPU 使用率是否异常?


一、架构解析

1. 核心技术栈
  • Dify:智能体构建平台,负责指令理解 + Agent 推理 + 执行工具

  • Prometheus:监控系统,提供指标查询接口

  • Prometheus MCP Server:将 Prometheus 的 query API 封装为 MCP 工具,使大模型可直接调用

  • LLM(如 DeepSeek 或 OpenAI 模型):智能体推理引擎

2. 架构图

二、MCP部署与配置

步骤 1: 准备Prometheus环境

这里假设你已经搭建好Prometheus服务,并做好了各种exporter(如,node_exporter)和k8s各监控资源的接入。

步骤 2: 部署 Prometheus MCP Server

目前提供Prometheus mcp服务的开源项目并不少,我找了一个亲测可用的项目,地址为:https://github.com/tjhop/prometheus-mcp-server

它的README里提供了详细的部署步骤,你可以根据你的使用场景来选择不同的安装方法,我这里使用的是docker的方式启动服务:

docker run -d -p 8080:8080 ghcr.io/tjhop/prometheus-mcp-server:latest --prometheus.url "http://172.17.0.1:9090" --mcp.transport "http" --web.listen-address ":8080"

注意,需要在Prometheus那台机器上运行该容器,并且我这里假设Prometheus是二进制方式启动,并非容器化,172.17.0.1为宿主机docker0的ip,这样容器内部可以通过该ip访问到宿主机

步骤 3: 在 Dify 中配置 MCP 工具

在 Dify 的界面中,进入工具 → MCP,点击 “添加MCP服务”。

在配置中填写:

1)服务端点URL:http://<host>:8080/mcp(这里host地址就是你部署Prometheus MCP服务的IP地址)

2)名称、服务器标识:prometheus-mcp

3)认证:无认证

等待授权后,可以看到该mcp包含24个工具。


三、构建智能体

1. 在Dify创建Agent应用

2. 设置提示词

你是企业级 AIOps 智能体,能够根据用户自然语言意图,自动分析、组合 PromQL,并通过prometheus-mcp工具调用进行查询。
任务包括但不限于:- 性能巡检(CPU、内存、磁盘、网络)- Pod / Node 健康分析- 告警根因定位- 指标趋势分析- 指标对比 / 环比
如果需要查询 Prometheus,请你主动调用相应的MCP工具。请在给出结论时说明推理逻辑,输出可执行建议。

3. 添加工具

点击“工具”右侧的“添加”,找到prometheus-mcp,点击添加全部

4. 智能体测试

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询