部署DeepSeek，你的GPU够用吗？

发布日期：2025-02-12 18:06:18 浏览次数： 3844

作者：阿里云开发者

微信搜一搜，关注“阿里云开发者”

引言

随着DeepSeek的热度不断攀升，关于如何复现或部署DeepSeek的文章层出不穷。无论是直接在官网使用，还是通过三方平台调用，无论是API接入亦或是本地及云端部署，归根结底还是在根据具体的情况从性能、费用和安全性的不可能三角中寻找平衡。

对大多数普通用户来说，第三方平台提供的网页、客户端和 API 服务可能是最便捷的选择。例如，阿里云推出的百炼API调用，具体教程可参考历史文章，这些服务不仅易于上手，还能提供稳定的支持和维护，确保用户体验的流畅性。

?100万免费 Token！DeepSeek-R1满血版即刻拥有

对于那些希望进一步自主部署但资源有限，并且需要推理加速和支持并发的用户，更便捷的云上一键部署方案是理想选择。这种方案开箱即用，具备弹性可伸缩和充足的算力优势，允许用户基于私有数据进行模型微调和参数调整，以适配垂直领域的需求。

?阿里云PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型

基于函数计算部署 DeepSeek 模型，支持 Ollama/Transformers 等框架，并能构建多样化的模型对话界面，如 OpenWebui 和 ChatGPTNext。对于技术爱好者，试图做出更多尝试并且期望获得完全自主可控大模型的用户，使用 GPU 部署可以根据需求自定义环境配置，例如安装特定版本的 CUDA 和深度学习框架等。

?0代码！2种方式一键部署 DeepSeek 系列模型

GPU 服务器提供了强大的计算能力，适用于深度学习、科学计算、图形可视化和视频处理等多种应用场景。云端部署的优势：

部署效率与易用性

云端部署无需复杂的环境配置和硬件搭建，简单几步，最快 10 分钟就能快速实现不同尺寸的 DeepSeek 模型部署和应用。

算力需求与成本优化

云端部署提供了弹性、充足的算力支持，同时相比本地部署需要购买和维护昂贵的 GPU 硬件，云端部署按需付费的模式可以显著降低硬件成本。

唾手可得的创新资源

云端部署支持快速迭代和优化，开发者可以利用云平台提供的工具和资源，快速进行模型训练、调优和更新，加速创新。

模型部署

本文介绍如何将 DeepSeek-R1 开源模型部署到 GPU 云服务器，在 GPU 云服务器上安装与配置 Ollama 和 Open WebUI。Ollama 负责托管 DeepSeek-R1 模型，Open WebUI 则为用户提供友好的交互界面。GPU 云服务器凭借其高性能并行计算架构，可以显著加速大模型的推理过程，特别是在处理大规模数据和高并发场景，可以有效提升推理速度和推理吞吐量。专有网络 VPC 和交换机用于资源隔离和安全管理，确保数据传输的安全性和网络的高可靠性。

本文以 DeepSeek-R1-Distill-Qwen-7B 为例进行演示，该版本是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于 DeepSeek-R1 的推理能力，通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上，从而在保持高效性能的同时降低了计算成本。用户可以根据实际需求选择其他参数规模的 DeepSeek-R1 模型，并相应调整实例规格配置。

方案架构

按照本方案提供的配置完成部署后，会在阿里云上搭建一个如下图所示的运行环境。实际部署时，您可根据具体的资源规划调整部分配置，但最终的运行环境将与下图展示的架构相似。

环境准备

在开始部署模型之前，需要进行一系列的环境准备工作。这些步骤包括创建专有网络 VPC 和交换机、配置安全组、创建 GPU 云服务器实例。

一、创建专有网络 VPC 和交换机

您需要创建专有网络 VPC 和交换机，为云服务器 ECS 实例构建云上的私有网络。

登录专有网络管理控制台[1]。
在顶部菜单栏，选择华东 1（杭州）地域。
在左侧导航栏，单击专有网络。
在专有网络页面，单击创建专有网络。
在创建专有网络页面，配置 1 个专有网络和 1 台交换机。配置交换机时，请确保交换机所属的可用区的 ECS 处于可用状态。

二、创建安全组

您已经创建了专有网络 VPC 和交换机。接下来您需要创建 1 个安全组，用于限制该专有网络 VPC 下交换机的网络流入和流出。

登录ECS 管理控制台[2]。
在左侧导航栏，选择网络与安全>安全组。
在顶部菜单栏，选择华东 1（杭州）地域。
在安全组页面，单击创建安全组。
在创建安全组页面，创建 1 个安全组。

三、创建 GPU 云服务器

您已经创建好专有网络 VPC 和交换机等资源。接下来您需要创建 1 个 GPU 云服务器实例，用于部署应用程序。

登录ECS 管理控制台[2]。
在左侧导航栏，选择实例与镜像 > 实例。
在顶部菜单栏，选择华东 1（杭州）地域。
在实例页面，单击创建实例。
下表中未说明的参数，在本方案中可使用默认值。

应用部署

接下来我们使用 Ollama 框架来部署 DeepSeek-R1 模型，使用 Open WebUI 调用模型服务。

一、登录服务器

登录 ECS管理控制台[2]。
在左侧导航栏，选择实例与镜像>实例。
在顶部菜单栏，选择华东1（杭州）地域。
部署示例应用程序。

在实例页面，找到前面步骤中创建的 ECS 实例，查看IP 地址列，记录公网 IP ，然后在其右侧操作列，单击远程连接。
在远程连接对话框的通过 Workbench 远程连接区域，单击立即登录，然后根据页面提示登录。

输入密码并点击确定按钮，通过 Workbench 远程连接至 ECS 控制台。
如图所示 GPU 驱动尚未完成安装，请等待 10-20 分钟，安装完成后实例将自动重启。

二、部署 Ollama

执行以下命令部署 Ollama 模型服务。

curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/ollama_install.sh|sh

2. 如下图所示，说明 Ollama 部署完成。

执行以下命令拉取模型。

ollama pull deepseek-r1:7b

执行以下命令，运行模型，运行成功后，在键盘上敲击两次回车键。

ollama run deepseek-r1:7b &

三、部署 Open WebUI

执行以下命令部署 Open WebUI 应用。

curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/install.sh|sh

2. 部署完成后，可以看到控制台中输出Installation completed。

应用体验

一、访问示例应用

在浏览器中访问http://<ECS公网IP>:8080，访问 Open WebUI。

说明

请将 <ECS公网IP> 更改为应用部署步骤记录的公网 IP。

二、与模型对话

在文本输入框中可以进行对话交互。输入问题你是谁？或者其他指令后，调用模型服务获得相应的响应。

三、使用 Chatbox 客户端配置 Ollama API 进行对话（可选）

访问 Chatbox 下载地址[5]下载并安装客户端，本方案以 macOS 为例。

运行并配置 Ollama API ，单击设置。

下拉选择模型提供方Ollama API，填写 API 域名 http://<ECS公网IP>:11434，下拉选择模型deepseek-r1:7b，最后单击保存。

在文本输入框中可以进行对话交互。输入问题你是谁？或者其他指令后，调用模型服务获得相应的响应。

完成及清理

清理资源

释放 1 台 GPU 云服务器实例：登录ECS 控制台[2]，在实例页面，找到目标实例，然后在操作列选择>释放，根据界面提示释放实例。
删除 1 个安全组：登录ECS 控制台[2]，在安全组页面，选择目标安全组，然后在操作列单击删除。
释放 1 台交换机：登录专有网络控制台[4]，在交换机页面，找到目标交换机，然后在操作列单击删除，按照界面提示释放实例。
释放 1 个专有网络 VPC：登录专有网络控制台[1]，在专有网络页面，找到目标 VPC，然后在操作列单击删除，按照界面提示释放实例。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-01

在 OpenCode 中接入本地模型：Ollama 部署与配置完全指南

2026-07-01

实测腾讯开源的 BrowserSkill：让 AI 直接用你登录好的浏览器

2026-07-01

阶跃开源JetSpec，大模型推测解码提速近10倍

2026-06-30

花叔的这个神器直接让你的AI Agent出高保真原型、PPT和动画，20k stars不是盖的

2026-06-30

阿里达摩院开源语音识别：比Whisper快170倍还免费，CPU就能跑

2026-06-30

MiniMax M3 实测：第一流的模型，已经对执行层动手了

2026-06-30

DSpark：DeepSeek 如何让大模型推理提速 85%

2026-06-30

告别云端付费！3秒克隆你的声音，这款开源AI不用GPU，手机CPU就能实时跑

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-22

炸裂！Seedance 2.0 免费用！全网第一只接入的开源龙虾，效果离谱

2026-04-02

Claude 的金融 Skills 开源了

2026-05-10

Ollama 换引擎，苹果 M5 封神了

2026-05-06

Qwen3.7来了，全球排名第13，国内第一

2026-05-20

亲测有效！Codex桌面版免费接入DeepSeek V4

2026-05-31

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw