微信扫码
添加专属顾问
我要投稿
腾讯开源知识库系统WeKnora,集成大语言模型实现专业文档检索,手把手教你NAS部署体验!核心内容: 1. WeKnora框架的核心技术与RAG机制解析 2. 系统支持的六大功能特性与多格式处理能力 3. 飞牛NAS详细部署教程与Docker配置指南
大家好,我是Jack Bytes,一个专注于将人工智能应用于日常生活的程序猿,平时主要分享AI、NAS、开源项目等。
兄弟们,腾讯最近开源了一个知识库系统,将大语言模型集成到了文档理解和语义检索框架,能够为结构复杂、内容异构的文档提供更加专业的检索。
今天来一起看看这个知识库系统吧,并在飞牛 NAS上部署一下玩玩。
WeKnora(维娜拉)是一款基于大语言模型(LLM)的文档理解与语义检索框架,专为结构复杂、内容异构的文档场景而打造。
该框架采用模块化架构,融合了多模态预处理、语义向量索引、智能召回与大模型生成推理等技术,构建起高效、可控的文档问答流程。
其核心检索流程基于RAG(Retrieval - Augmented Generation)机制,能将上下文相关片段与语言模型结合,从而实现更高质量的语义回答。
WeKnora 拥有诸多强大的功能特性,使其在文档处理领域脱颖而出:
灵活扩展:从解析、嵌入、召回到生成的全流程都进行了解耦,便于灵活集成与定制扩展,支持自定义 embedding 模型,兼容本地部署与云端向量生成接口,也能灵活切换主流向量索引后端。
高效检索:混合了关键词、向量、知识图谱等多种检索策略,支持稠密 / 稀疏召回、知识图谱增强检索等多种方式,可自由组合召回 - 重排 - 生成流程。
本文教大家怎么在飞牛 NAS 上部署,主要是通过 Docker 进行部署,理论上在其他支持 Docker 的设备上也可以部署。
首先打开飞牛的SSH 登录功能:
执行下面的命令切换到root
账户:
sudo -i
然后切换到 NAS 的指定目录(比如我这里创建了一个 docker 目录):
然后执行下面的命令 clone 项目:
git clone https://github.com/Tencent/WeKnora.git
然后进入到项目根目录:
cd WeKnora
配置环境变量:
# 复制示例配置文件
cp .env.example .env
# 编辑 .env,填入对应配置信息
# 所有变量说明详见 .env.example 注释
然后执行下面的命令启动项目:
docker compose up -d
中间如果遇到postgres
的端口问题,可以在.env
中修改postgres
的端口。
如果遇到 80 端口的问题,可以在 docker-compose.yml
中修改80 端口为其他的:
如果出现下面的内容,则表示启动成功:
与此同时,可以在飞牛 OS 的 Docker 管理界面看到运行着的项目:
至此,WeKnora就搭建好了,下面我们一起来体验一下。
在浏览器输入http://IP:Port
,其中 IP 是飞牛 OS 的 IP,Port 是上面修改的 30080 端口,比如我的是:http://192.168.66.6:30080
:
在进入首页之后,首先会让设置一些信息,比如:大模型配置、Embedding 模型配置、Rerank 模型配置、多模态配置、文档分割配置。
其中大模型配置可以实用本地的 Ollama 模型,或者远程的大模型:
Embedding 模型也是,可以选择用本地或者远程的:
设置好之后,保存进入主页面:
上传几个文档看看,可以看到知识库自动分析了文档的内容,并进行了总结:
下面提问下看看:
可以看到知识库参考了一些文档内容,并进行了总结回答:
好了,今天的介绍就到这里了,大家感兴趣的话快去试试吧!
WeKnora 作为一款基于大模型的文档理解检索框架,凭借其精准的文档理解能力、智能的推理功能、灵活的扩展特性、高效的检索机制以及简单易用和安全可控等优势,在企业知识管理、科研文献分析、产品技术支持、法律合规审查、医疗知识辅助等众多场景中都能发挥重要作用。
如果你对这个知识库系统感兴趣,快去试试吧!
一个专注于将人工智能应用于日常生活的半吊子程序猿!
平时主要分享AI、NAS、Docker、搞机技巧、开源项目等技术,喜欢的话请关注吧!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-17
苹果 macOS 本地部署最新 GPT-5 CodeX,网友集体抛弃 Claude Code
2025-09-17
Qwen3-Next 首测!Qwen3.5的预览版?但为什么我的测试一塌糊涂?
2025-09-17
Microsoft 推出用于更长对话式 AI 音频的 VibeVoice 且开源
2025-09-16
[开源]Docling:AI时代的全能文档处理引擎
2025-09-15
如何使用 SGLang 部署 LongCat-Flash 模型
2025-09-14
我的个人管理系统只有一个Markdown:实战篇,我把Prompt开源了,照着SOP做
2025-09-12
3000字长文:基于Dify的公司制度检索问答Agent实践
2025-09-12
Google发布最新开放文本嵌入模型:EmbeddingGemma
2025-07-23
2025-08-20
2025-09-07
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12
2025-07-31
2025-09-17
2025-09-09
2025-09-08
2025-09-07
2025-09-01
2025-08-16
2025-08-13
2025-08-11