我要投稿

DeepSeek本地部署+知识库+联网搜索，终极版方案，保姆级教程！

发布日期：2025-02-13 16:58:40 浏览次数： 3599

作者：格雷的梦呓

微信搜一搜，关注“格雷的梦呓”

今天就来解决这些问题，一个本地部署+私人知识库+联网搜索的终极方案。

本地部署DeepSeek

如果你是老粉，看过我以前的文章，这一步可跳过，直接ollama run deepseek-r1:1.5b。

首先打开ollama官网：https://ollama.com

下载，一步步安装即可。

CMD命令窗口运行，启动deepseek-r1模型：

ollama run deepseek-r1:7b

根据自己显卡大小，选择对应的参数规模，1.5b最小，可以先用这个来尝试，完成以后再跑更大的参数模型。

另外有人反馈，任务管理器显示，大模型在执行的时候，回答很慢，GPU几乎没动，全都是CPU在跑。

大概率是安装了老版本的Ollama，官网下载最新的文件重新安装即可。

安装Page Assist插件

网络条件允许的话，直接谷歌商店搜索下载，下面介绍的方法国内网络可用。

打开网站Crx搜搜：

https://www.crxsoso.com

搜索：Page Assist，第一个就是今天主角，本地AI模型的Web UI。

下载到本地，谷歌浏览器打开：chrome://extensions/，右上角打开开发者模式，将下载好的crx文件拖入浏览器，完成插件的安装。

浏览器上方的扩展程序列表，找到Page Assist插件，点击进入WebUI界面。

左上角可以选择ollama的所有本地模型，所以选deepseek-r1:7b就好了。

到这一步就可以流畅地使用deepseek大模型啦。

首次使用是英文版，不太习惯，点击右上角设置齿轮，【General Settings】，分别选择【简体中文】。

设置联网搜索

依然是右上角设置齿轮，【一般设置】，下方有个【管理网络搜索】，选择合适的搜索引擎，总搜索结果默认是2，可以适当调大一些，这样参考网络资源的权重更大。

记得点击保存。

回到聊天页面，打开聊天框下方的【搜索互联网】开关，联网搜索功能就搞定啦。

比如问一个关于《哪吒2》的评价，除了看到思考过程，下方还有列出了引用的数据来源。

现在，完成了本地部署+联网搜索，还差知识库...

搭建私人知识库

CMD窗口运行命令：

ollama pull nomic-embed-text

回到设置，【RAG设置】，文本嵌入模型选择【nomic-embed-text:latest】，保存。

文本嵌入模型的作用是，让大模型理解我们的文本资料。

左侧菜单【管理知识】，【添加新知识】，指定知识的标题，并上传我们的本地资料，提交。

这里的知识，指的就是知识库，当状态是【已完成】，代表大模型已经处理完成了。

回到聊天窗口，右下方就可以选到刚刚添加的知识库。

提问：

DeepSeek-R1是什么？

本地大模型完美地回答了我们的问题，知识库搭建完成！

简单回顾一下，这次的方案：Ollama + Page Assist插件，没有docker的复杂配置，而且完美地实现了本地部署+联网搜索+知识库。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-14

我微调了一个LangChain专家模型，离Vibe Agent又近了一步

2025-12-11

左脚踩右脚：大模型的有趣且简单的微调方式“SHADOW-FT”

2025-12-11

大模型训练的高效内存解决方案：流水线感知的细粒度激活卸载，实现显存开销与吞吐性能的联合最优

2025-12-08

一杯咖啡成本搞定多模态微调：FC DevPod + Llama-Factory 极速实战

2025-12-04

OpenAI公开新的模型训练方法：或许能解决模型撒谎问题，已在GPT-5 thiking验证

2025-11-23

微调Rerank模型完整指南

2025-11-22

大模型微调全流程实战指南：基于IPO框架的深度解析与优化

2025-11-21

AI基础 | Qwen3 0.6B 微调实现轻量级意图识别

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

微调已死？Google 和斯坦福论文指出AI 学习新范式

2025-10-12

用Macbook微调Qwen3！手把手教你用微调给Qwen起一个新名字

2025-10-14

从零教你微调一个专属领域大模型，看完小白也能学会炼丹!（完整版）

2025-10-21

一位淘宝工程同学的大模型LoRA微调尝试

2025-09-24

在Colab中微调Qwen3-4B模型实战指南

2025-09-20

如何将 AI 代码采纳率从30%提升到80%？

2025-09-25

基于昇腾NPU的Qwen3量化因子代码生成微调实战

2025-11-05

2张4090竟能本地微调万亿参数Kimi K2！趋境联合清华北航把算力门槛击穿了

2025-11-05

AI基础 | Qwen3 0.6B 微调实现轻量级意图识别

2025-11-21

OpenAI公开新的模型训练方法：或许能解决模型撒谎问题，已在GPT-5 thiking验证

2025-12-04

大家都在问

LoAR做Fine-Tuning微调原理到底是什么？

2025-11-19

如何将 AI 代码采纳率从30%提升到80%？

2025-09-25

大模型微调，为什么99%的企业都不应该碰这个坑？

2025-06-20

万不得已，不要对 LLM 进行微调？

2025-06-17

可以将任何符合OpenAPI规范的接口转 MCP Server吗？

2025-05-21

OpenAI发布GPT-4.1系列模型，对行业最大吸引力是什么？

2025-05-17

私有部署大模型需要多少显存？

2025-05-14

软件公司如何为AI的下半场做准备？

2025-05-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部