我要投稿

AI开发者必看：深度解析MCP，打造高效LLM应用的秘密武器！

发布日期：2025-08-02 09:46:31 浏览次数： 1735

作者：活水智能

微信搜一搜，关注“活水智能”

如果你活跃于技术影响者聚集的社交媒体平台，那么现在想必已经听说过模型上下文协议（MCP）了。

诚然，它可能曾受到过度炒作，但了解它仍是十分必要的，因为MCP注定会成为未来AI流水线中的重要组成部分。

MCP本身，抑或是基于其演进的各项改进，都将成为未来AI流水线中不可或缺的一环。

在本文中，我们将探讨MCP的工作原理，并通过构建一个使用它的智能代理系统来加深理解。

让我们开始吧！

为什么最初要构建MCP这样的东西？

假设现在是2024年初，你正在构建一个用于股票市场分析的LLM应用。

你可能需要：

• 为应用中使用的不同LLM编写特定代码。
• 如果数据存储在不同数据库中，需要为每个数据库编写特定代码。
• 为每个金融数据源（如Yahoo Finance、Bloomberg、SEC文件等）定义自定义API接口。
• 构建自定义数据预处理管道。

等等！

这无疑会带来诸多不便！

任何一个部分的微小改动都会迫使你重写代码，导致系统难以扩展。

正因如此，Anthropic开源了MCP，使得自 2024年11月之后，基于LLM的应用开发变得更加便捷。

让我们来了解一下是如何实现的。

什么是MCP？

根据官方文档所述：

模型上下文协议（MCP）是一个开放协议，它规范了应用程序如何向LLM提供上下文。

以往，我们通过分散且不稳定的集成方式连接LLM与数据源，而MCP则以统一协议取代了这种局面，从而使连接更可靠，也大大简化了我们的工作。

以下是Anthropic对它的评价：

开发人员现在可以基于一个标准协议进行构建，而不必为每个数据源维护独立的连接器。
可以将MCP想象成AI应用的USB-C接口。
正如USB-C提供了一种标准化方式，将设备连接到各种外部设备和附件一样，MCP也提供了一种标准化的方式，将AI模型连接到不同的数据源和工具。
—— Anthropic 关于 MCP 的说明 (https://www.anthropic.com/news/model-context-protocol)

一言以蔽之：

模型上下文协议是一个“协议”，它允许“模型”获取相关的“上下文”。

使用MCP前后LLM与数据源连接的简化示意图

现在我们理解了MCP解决的问题，接下来学习它的组成部分。

MCP的运作机制

MCP主要由三个核心组件构成：

1. 主机（Hosts）
2. 服务器（Servers）
3. 客户端（Clients）

我们来逐一讲解。

MCP主机

这些是用户直接交互的应用程序。

例如，Claude桌面版、集成开发环境（如Cursor和VS Code），或其他由AI驱动的工具。

这是LLM运行的核心所在。

MCP服务器

这些是小巧、专用的程序，根据其用例公开特定的功能。

这些服务器可以通过可由MCP主机内的LLM调用的工具（Tools）(https://modelcontextprotocol.io/specification/2025-06-18/server/tools) 安全地连接到资源（Resources）(https://modelcontextprotocol.io/specification/2025-06-18/server/resources)。

这些资源可以是：

• 本地文件/服务/数据库
• 基于网络的各种服务，例如数据库、电子邮件、天气、日历等（通过API）

服务器还公开提示（Prompt）(https://modelcontextprotocol.io/specification/2025-06-18/server/prompts) 模板，客户端可以使用这些模板从MCP服务器获取结构化响应。

MCP客户端

这是主机的一个组件，充当通信层。

每个客户端与一个MCP服务器保持专用连接，负责处理协议的请求-响应模式、错误处理以及连接生命周期(https://modelcontextprotocol.io/specification/2025-06-18/basic/lifecycle) 管理。

你可以把它们看作是能够理解主机语言和MCP协议的“翻译官”。

客户端如何与服务器通信？

传输机制（Transport）(https://modelcontextprotocol.io/docs/concepts/transports) 是一种通信通道，负责处理客户端与服务器间信息（消息）交换的底层原理。

MCP中交换的消息共有三种类型，它们均采用 JSON-RPC 2.0(https://www.jsonrpc.org/specification) 格式。

这些消息类型是：

1. 请求（Requests）： 请求某项内容的消息，期望得到响应。

在下面的示例中，客户端请求服务器为查询“旧金山”调用“天气”工具，并期望得到响应。

{
  "jsonrpc":"2.0",
"id":1,
"method":"tools/call",
"params":{
    "name":"weather",
    "arguments":{
      "location":"San Francisco"
    }
}
}

2. 响应（Responses）： 回复先前请求的消息。

在下面的示例中，服务器回复了ID为1的请求，提供了查询“旧金山”的具体天气数据：温度（temperature）和状况（condition）。

{
  "jsonrpc":"2.0",
"id":1,
"result":{
    "temperature":"72°F",
    "condition":"sunny"
}
}

3. 通知（Notifications）： 告知某事的消息，不期望得到响应。

在下面的示例中，服务器发送了一个进度更新消息，但不期望任何回复（请注意没有id字段）。

{
  "jsonrpc":"2.0",
"method":"$/progress",
"params":{
    "message":"Processing data...",
    "progress":0.8
}
}

MCP使用以下两种常见的通信机制来交换这些消息：

1. 标准输入/输出（stdio）
这种机制允许通过计算机上的标准输入和输出流进行通信。它是一种更简单的机制，最适用于：

• 本地集成（当客户端和服务器位于同一台机器上时）
• 构建命令行工具和使用shell脚本

2. 流式HTTP（Streamable HTTP）
这种机制使用：

• HTTP POST 请求用于客户端到服务器的通信，以及
• 可选的服务器发送事件（SSE）流用于服务器到客户端的通信。
它最适用于构建 基于Web的集成，可以支持多个并发客户端和可恢复的连接。

至此，关于MCP的理论知识讲解已告一段落。

接下来，我们将进入代码实践环节！

构建一个基于MCP的物理问答智能代理系统

自MCP发布以来，MCP服务器的数量呈爆炸式增长。

可以在这里找到这些服务器的完整列表：https://github.com/modelcontextprotocol/servers

按照每个服务器的说明，将这些服务器与主机（如Claude桌面版或IDE）集成非常容易。

但既然我们正在学习从基础构建事物，那就不妨自己实现一个MCP服务器吧。

我们将构建一个服务器，其中包含多个用于计算物理问题解决方案的工具。

以下是实现步骤：

1. 使用“uv”创建新项目

本教程中，我们将使用“ uv(https://docs.astral.sh/uv/) ”作为包管理器。

如果你是新手，请按照此页面上的说明(https://docs.astral.sh/uv/getting-started/installation/) 进行安装。

uv init physics-solver-mcp

cd physics-solver-mcp

uv venv .venv

source .venv/bin/activate

2. 安装依赖

在完成项目初始化后，我们需要安装几个关键的依赖包，包括mcp和crewai-tools。我们通过以下命令安装 mcp Python包：

uv add mcp crewai "crewai-tools[mcp]"

3. 设置环境变量

我们在项目文件夹中创建一个名为.env的文件，其中包含我们的OpenAI API密钥。

在调用基于gpt-4o-mini模型的代理时将使用此密钥。

OPENAI_API_KEY="YOUR_KEY_GOES_HERE"

4. 创建MCP服务器

我们将使用 FastMCP (https://github.com/jlowin/fastmcp)，它是用于在Python中处理模型上下文协议的标准框架。

我们创建一个名为physics_server.py的文件，并编写一些与服务器相关的工具，每个工具都使用@mcp.tool()装饰器进行指定。

"""一个实现模型上下文协议的物理MCP服务器。
此服务器提供物理公式作为工具，可供MCP客户端发现和使用。
"""

from mcp.server.fastmcp import FastMCP

mcp = FastMCP("Physics-Server")

# 计算动能的工具
@mcp.tool()
defkinetic_energy(mass: float, velocity: float) -> dict:
    """计算运动物体的动能。

    公式: KE = 1/2 × 质量 × 速度²

    参数:
        mass: 物体质量，单位千克 (kg)。必须为正值。
        velocity: 物体速度，单位米/秒 (m/s)。可为正或负。

    返回:
        动能，单位焦耳 (J)
    """
    if mass <= 0:
        raise ValueError("质量必须为正值")

    ke = 0.5 * mass * (velocity ** 2)

    return ke

# 计算重力势能的工具
@mcp.tool()
defgravitational_potential_energy(mass: float, height: float, g: float = 9.81) -> dict:
    """计算物体在特定高度处的重力势能。

    公式: PE = 质量 × 重力加速度 × 高度

    参数:
        mass: 物体质量，单位千克 (kg)。必须为正值。
        height: 物体相对于参考点的高度，单位米 (m)。必须为非负值。
        g: 重力加速度，单位米/秒²。默认为 9.81 (地球表面)。

    返回:
        重力势能，单位焦耳 (J)
    """
    if mass <= 0:
        raise ValueError("质量必须为正值")
    if height < 0:
        raise ValueError("高度必须为非负值")
    if g <= 0:
        raise ValueError("重力加速度必须为正值")

    pe = mass * g * height

    return pe

# 减去两个数字的工具
@mcp.tool()
defsubtract(a: float, b: float) -> dict:
    """减去两个数字。

    参数:
        a: 第一个数字。
        b: 第二个数字。

    返回:
        a 和 b 之间的差值。
    """

    return a - b


if __name__ == "__main__":
    mcp.run(transport="stdio") # 使用STDIO传输

5. 创建MCP客户端

接下来，我们用 CrewAI(https://www.crewai.com/) 框架搭建一个智能代理系统，该系统将使用我们的MCP服务器工具来解决给定的物理问题。

如果你是CrewAI的新手，可以考虑查阅这篇关于构建你的第一个AI代理的教程(https://intoai.pub/p/building-your-first-ai-Agent)，了解如何使用这个框架。

crewai-tools中的 MCPServerAdapter(https://docs.crewai.com/en/mcp/overview#key-concepts-%26-getting-started) 类是连接MCP服务器并使其工具可供CrewAI代理使用的主要方式。

使用Python上下文管理器（with语句）是此类的推荐方法，因为它会自动处理与MCP服务器连接的启动和停止。

from crewai import Agent, Task, Crew
from crewai_tools import MCPServerAdapter
from mcp import StdioServerParameters
import os

# 为物理服务器创建一个StdioServerParameters对象
server_params=StdioServerParameters(
    command="python3",
    args=["physics_server.py"],
    env={"UV_PYTHON": "3.11", **os.environ},
)

# 使用StdioServerParameters对象创建MCPServerAdapter
with MCPServerAdapter(server_params) as tools:
    print(f"可用的物理工具: {[tool.name for tool in tools]}")

    agent = Agent(
        role="物理专家",
        goal="使用基本能量计算解决物理问题。",
        backstory="一位经验丰富的物理学家，对经典力学和能量原理有深入了解。能够应用动能和势能概念解决实际问题。",
        tools=tools,
        verbose=True,
    )

    task = Task(
        description="解决这个物理问题: {physics_problem}",
        expected_output="详细的分步解决方案，显示所有计算、中间值和带有正确单位的最终答案。使用可用的物理工具进行动能和势能计算。",
        agent=agent,
    )

    crew = Crew(
        agents=[agent],
        tasks=[task],
        verbose=True,
    )

    # 物理问题
    crew_inputs = {
        "physics_problem" : """
        一辆质量为800公斤的过山车从50米高的山顶静止启动。
        随后，过山车沿山坡下行，到达底部时速度达到25米/秒。

        已知:
        - 汽车质量: 800公斤
        - 初始高度: 50米
        - 最终速度: 25米/秒
        - 重力加速度: 9.81米/秒²

        问题:
        1. 计算过山车在山顶的初始重力势能。
        2. 计算过山车在山底的最终动能。
        3. 比较初始势能和最终动能，并解释任何差异。
        4. 如果过山车要爬上另一座山，如果其所有动能都转化回势能，它能达到的最大高度是多少？
        """
    }

    result = crew.kickoff(inputs=crew_inputs)

    print(result)

我们通过以下命令运行MCP客户端。

uv run client.py

这是我们得到的结果，运行效果符合预期！

1. Initial Gravitational Potential Energy: 392400 J
2. Final Kinetic Energy: 250000 J
3. The initial potential energy is greater than the final kinetic energy due to energy losses from friction and air resistance.
4. Maximum Height: 31.87 m

从日志中可以看到，我们的代理顺利调用了这些MCP服务器工具完成了任务。

关于MCP的讲解到这里就结束了。

你是否在自己的应用程序中使用过它？请在下方评论区分享你的经验

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业