我要投稿

免费GPU算力部署DeepSeek-R1 32B

发布日期：2025-05-30 11:31:10 浏览次数： 2085

作者：AI大模型应用开发

微信搜一搜，关注“AI大模型应用开发”

前言

DeepSeek-R1发布最新版本DeepSeek-R1-0528，显著提升了模型的思维深度与推理能力，在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩，并且在整体表现上已接近其他国际顶尖模型，如 o3 与 Gemini-2.5-Pro。另外，API接口还增加了Function Calling和JsonOutput 的支持。

DeepSeek-R1团队已经证明，大模型的推理模式可以蒸馏到小模型中，与通过强化学习在小模型上发现的推理模式相比，性能更优。ollma上可以下载不同参数尺寸(1.5B到70B)的蒸馏模型，参数越大，性能越好。

飞桨AI Studio每日免费提供GPU算力资源，具体配置如下：

• V100 16GB显存：可以跑14B尺寸模型，每日免费使用4小时
• VT100 32GB显存：可以跑32B尺寸模型，每日免费使用2.7小时

创建项目

打开https://aistudio.baidu.com/account，点击右上方“登录”按钮，用百度账号登录即可。

打开https://aistudio.baidu.com/my/project，点击右上方“创建项目”，选择“Notebook”，会弹出下方的对话框。填写“项目名称”，点击创建。

在打开的页面中，点击上面的“未运行”

在弹出的页面中，选择“基础版”运行环境。“基础版”运行环境免费不限时，用于下载Ollama和deepseek模型。等下载完后再切换到GPU环境。

环境启动后，点击右上角的“专业开发”，进入Codelab IDE界面

Codelab IDE界面如下

安装ollama

设置目录

在Codelab IDE界面中，选择“文件”=》“新建”=》“终端”，进入shell界面，执行以下命令(每次启动环境都要执行)，以便ollama下载的模型能保存在~/work/.ollama，这样才能持久化保存。

cd ~/work && mkdir -p .ollama && ln -sfn ~/work/.ollama ~/

下载ollama

飞桨AI Studio无法访问github，需通过代理网站ghproxy.cn进行下载。命令如下

cd ~/work
wget -c https://ghproxy.cn/https://github.com/ollama/ollama/releases/download/v0.8.0/ollama-linux-amd64.tgz
tar zxf ollama-linux-amd64.tgz

下载deepseek模型

启动ollama服务

~/work/bin/ollama serve

新建终端，输入命令下载deepseek-r1 32b模型

~/work/bin/ollama pull deepseek-r1:32b

如果发现下载速度低于1MB/s，可尝试重新执行pull(但不要重启ollama serve的进程)。

启动deepseek

切换到GPU环境

打开https://aistudio.baidu.com/my/project，停止运行中的CPU环境

点击项目，在项目详情页面中，点击上面的“未运行”

在弹出的页面中，选择“V100 32GB”运行环境。每天免费获得8点算力，可用2.7小时，昨天用剩的算力可以结余到今天使用。

因为切换环境，系统需要同步文件，在Codelab IDE右下角会有同步进度显示。

启动ollama服务

cd ~/work && mkdir -p .ollama && ln -sfn ~/work/.ollama ~/  && ~/work/bin/ollama serve

启动deepseek

新建终端，输入以下命令启动deepseek

~/work/bin/ollama run deepseek-r1:32b

运行成功后就可以开始体验deepseek的魅力了。

测试

下图为经典问题：9.9和9.11比较，哪个更大

总结

本文介绍利用飞桨AI Studio每日免费提供GPU算力资源部署DeepSeek-R1 32B。进一步，还可以通过frp内网穿透让windows部署的dify连接飞桨服务器上部署的ollama。另外，我们也可以利用GPU算力学习其它知识：模型微调，模型训练，深度学习训练等。

#DeepSeek #免费GPU算力 #飞桨

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-05

开源算法能在 2025 年击败 GPT-5 吗？DeepSeek-V3.2 / Speciale 交出了一份答卷

2025-12-05

开源了首个用于诉讼的智能体框架 SuitAgent

2025-12-05

腾讯混元OCR大模型，本地部署，实测

2025-12-04

刚刚，法国Mistral 3系列模型发布，全部开源、全部多模态、全部能落地，对标中国模型

2025-12-04

Transformers来到了v5时代：从工具包到真理之源，AI时代的操作系统内核的极简进化论

2025-12-04

Mistral 3发布，14B多模态小模型表现优异

2025-12-04

ollama v0.13.1 发布：全新 Ministral-3 与 Mistral-Large-3 模型，增强工具调用与GPU

2025-12-03

从硅谷杀出来一个彻底开源的AI记忆系统，是真的优雅！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

DeepSeek又开源，这次是OCR模型！附论文解读！

2025-10-20

Claude不让用，有哪些国产模型能迎头赶上？

2025-09-08

全新AI编程工具 Google Antigravity 实测，特别适合产品经理

2025-11-19

发现一个超神的Github开源OCR项目，国产多模态杀疯了

2025-10-27

MiniMax悄悄发布M2，8%价格打出Claude级性能

2025-10-27

如愿以偿！Qwen3-VL再开源30B-A3B，附实测！

2025-10-03

Qwen3-Next 首测！Qwen3.5的预览版？但为什么我的测试一塌糊涂？

2025-09-17

DeepSeek-V3.2背后的国产算子编程语言TileLang是什么？如何保持性能领先的同时减少6倍代码量？

2025-09-29

n8n如何调用最近爆火的deepseek OCR？

2025-10-29

大家都在问

我们为什么选择 Spring AI 开发智能体，而不是 Dify？

2025-11-12

开源安全审核模型终极PK：Qwen3Guard、OpenAI-SafeGuard、Llama4-Guard谁才是王者？

2025-11-10

DeepSeek-OCR到底厉害在哪？

2025-11-03

n8n如何调用最近爆火的deepseek OCR？

2025-10-29

小红书入局AI智能体开源DeepAgent，在计划什么更新？

2025-10-28

埃森哲的大裁员，向市场发出了什么信号？

2025-10-13

DeepSeek-V3.2背后的国产算子编程语言TileLang是什么？如何保持性能领先的同时减少6倍代码量？

2025-09-29

Qwen3-Next 首测！Qwen3.5的预览版？但为什么我的测试一塌糊涂？

2025-09-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB