2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

WeKnora详解(一):腾讯开源的 LLM 知识框架,5 分钟跑通你的第一个问答机器人

发布日期:2026-06-29 20:26:24 浏览次数: 1509
作者:叨叨数码

微信搜一搜,关注“叨叨数码”

推荐语

腾讯开源的LLM知识框架WeKnora,帮你5分钟快速搭建智能问答机器人,轻松处理各类文档并实现智能推理。

核心内容:
1. WeKnora的三大核心能力与产品定位
2. RAG快速问答与ReAct Agent自主推理的实战解析
3. 上手体验与同类框架的对比亮点

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


WeKnora 详解系列 · 第一章

各位数码圈的老铁们,我是叨叨数码,又来给大家扒新货了。

这回咱们不聊手机、不聊耳机、不聊扫地机器人——咱们聊点"硬核"的东西:腾讯悄悄开源的一个 AI 知识框架,WeKnora。

说实话,第一眼看到这名字我是懵的:We + Knora?K 哪去了?看完 README 我才反应过来:这是 Knowledge + Aurora 拼一起的味儿,"知识的极光",挺浪漫。

当前版本 v0.6.2,GitHub 上 2,166 次提交,最新一次更新就在 6 月 25 日——比我手里那台小米 14 Ultra 推送系统还勤快。社区活跃度相当能打。

这一篇是系列开篇,我会用"数码博主拆新品"的姿势带你看它:这玩意儿定位是啥?对比同类有啥亮点?上手体验怎么样?——跟测手机一个套路。


一、开箱初印象:WeKnora 到底是个啥?

按照数码圈的规矩,新品上手第一件事——看"参数"和"定位"。

WeKnora 的官方定义有点抽象,我翻译成人话:

你扔给它一堆 PDF、Word、飞书文档、网页,它能帮你做出一个"会动脑子"的问答机器人。而且这个机器人不是只会死板地查文档,它还能自己推理、调用工具、甚至自动整理出一份知识库。

翻译成数码博主的话术:这玩意儿 = ChatGPT(会聊天)+ Confluence(会写文档)+ 私人秘书(会干活)三合一。是不是有点动心了?

但如果你只把它当成普通 RAG 工具,那就太小看它了。WeKnora 有三大核心能力,也是它和市面上其他开源 RAG 框架(比如 LangChain、LlamaIndex)拉开身位的关键:

能力 1:RAG 快速问答(基础款,但很扎实)

这是最经典的玩法:你问个问题,它先去知识库里把相关内容"扒"出来,再丢给大模型组织成自然语言回答。

重点是可溯源——回答里会带引用,告诉你"这句话是从哪个文档第几页扒出来的"。幻觉?基本不存在。

数码博主类比一下:相当于"你问它某款手机参数,它不光告诉你答案,还把发布会 PPT 第几页给你截出来"。

最适合客服、内部知识库、产品手册答疑这种"一问一答"的场景。

▲ WeKnora 智能问答界面

能力 2:ReAct Agent 自主推理(进阶款,会"动脑子")

RAG 有个致命短板:只能回答"知识库里现成有答案"的问题。

但现实里很多问题不是这样——比如老板问:"对比一下 Q3 和 Q4 的销售数据,再给我写份摘要"。这玩意儿光靠"找文档"搞不定,需要拆解、需要查数据库、需要写总结。

这时候 ReAct(Reasoning + Acting)循环 就上场了。简单说就是:Agent 会自己琢磨下一步该干嘛,然后真的去执行。

它可以自主决定:

  • "这个问题该查哪个知识库?"
  • "要不要调一下 MCP 工具(比如查 SQL、调个 API)?"
  • "要不要上网搜一搜最新信息?"
  • "中间步骤拿到结果了,要不要重新检索一次?"

整个推理 + 工具调用流程,全自动编排。你不用自己写 Agent 代码,不用自己接 LangChain 那一堆 API。

数码博主再类比一下:相当于你问"今年双 11 哪家手机最值得买",它不光给你推荐,还能自己爬评测、查电商价格、对比跑分,最后给你出一份选购指南。

▲ Agent 模式下的工具调用流程可视化

能力 3:Wiki 模式(v0.5 才 GA 的"杀手锏")

这一招是真正让我眼前一亮的。

想象一下这个场景:你手里有 100 个产品需求文档,乱七八糟、互相矛盾、没有目录。你要花一星期整理成一份内部 Wiki。

现在你把这些文档全部扔给 WeKnora,它会:

  • 自动提取关键概念、生成结构化目录
  • 识别文档之间的引用关系,自动建超链接
  • 画出一张知识图谱,让你一眼看清概念之间的关联
  • 后续新文档进来,它还能持续自维护,自动更新 Wiki

这已经不是"问答机器人"了,这是"知识工程自动化"。

数码博主角度翻译:相当于你把 100 篇发布会通稿扔进去,它自动给你整理成一份"2026 年手机行业白皮书",还自带脑图。

官方在 v0.5.2 把 Wiki 摄取能力扩到了 4 万文档的规模,企业级该有的体量基本够用了。

▲ Wiki 模式自动生成的 Markdown 知识库

▲ 自动生成的知识图谱


二、对比同类:WeKnora 适合谁上手?

数码圈有句老话:"不看价格谈性能都是耍流氓。" 咱换个说法:不看定位谈对比都是耍流氓

WeKnora 不是给"就想体验一下 ChatGPT"的人准备的。它有明确的目标用户画像,按"用户群"分一下:

用户类型
典型需求
WeKnora 给你的甜点
企业内部 IT / 平台团队
搞个内部知识库、AI 助手
私有化部署、4 级 RBAC、审计日志一把梭
客服 / 售前系统搭建者
对接企微、飞书、微信公众号
7+ IM 渠道原生支持,开箱即用
RAG 二次开发者
想换不同 LLM / 向量库 / Embedding
模块化设计,20+ LLM、8+ 向量库随便换
技术博主 / 数码圈老铁
想研究 RAG / Agent 完整工程实现
Go 1.26 源码 + 全模块化 + Langfuse 追踪

如果你是上面任意一种,继续往下看,保证有收获。

如果都不是也没关系——就当看个开源项目 demo,下饭也是极好的。


三、硬件参数:技术栈速览

看完了外观和定位,咱得上"跑分"了——给你一张 WeKnora 的"硬件清单":

  • 后端语言
    :Go 1.26.0(不是 1.21、不是 1.22,是相对激进的 1.26)
  • 前端
    :Web UI(支持热重载开发)
  • 文档解析
    :独立 docreader 模块(用 gRPC 通信,含 OpenDataLoader + PaddleOCR-VL)
  • 向量索引
    :HNSW 加速 pgvector(1024 维)
  • 检索方式
    :BM25 稀疏 / 稠密 / GraphRAG / 父子分块(花样挺多)
  • 可观测性
    :Langfuse(v0.6.2 后已移除 Jaeger,专注一个就行)
  • 加密
    :AES-256-GCM(API 密钥、凭证都加密存)
  • 部署
    :Docker / Docker Compose / Kubernetes (Helm) 三种姿势随便挑

一句话总结:全模块化管道设计,每个组件可替换

数码博主类比:相当于这机器每个零件都能拆下来换——嫌 GPU 不够强?自己换;嫌存储小?自己加。不像某些"全家桶",只能用原厂配件。

这就是它敢喊"企业级"的底气——不是堆功能,是把功能拆得足够细,让你能像乐高一样拼。


四、上手实测:5 分钟跑通你的第一个问答机器人

参数说完了,该上"实测"了

我把整个流程压到 4 步,按顺序执行即可。理论上 5 分钟之内你就能看到一个能跑能问的机器人。

Step 1:准备环境(30 秒)

确保你已经装好了两样东西:

  • Docker(推荐 20.10+)
  • Docker Compose(v2 版本,跟 Docker 一起装就行)
  • Git(废话,没有它怎么 clone)

还有:至少 4GB 可用内存,不然容器起不来别怪我没提醒——这玩意儿比手机测原神还吃内存。

Step 2:拉代码、改配置(1 分钟)

打开终端,敲下面三行:

git clone https://github.com/Tencent/WeKnora.git cd WeKnora cp .env.example .env

然后用你喜欢的编辑器(VSCode、Sublime、甚至 vim 都行)打开 .env 文件。

里面要改的核心就一项:LLM 的 API Key。WeKnora 支持 20+ 家大模型厂商(OpenAI、Azure、Anthropic、DeepSeek、Qwen、豆包、Gemini、Ollama……),挑你顺手的填上就行。

如果懒得改 .env,也能跑——v0.6.1 起内置了通过 YAML 声明式管理的 mock 模型,纯本地体验也凑合。但要看到真实问答效果,还是强烈建议配一个 Key。

没 API Key 又想跑?本地装个 Ollama 也行:

ollama serve > /dev/null 2>&1 &

Step 3:一键启动(2-3 分钟)

最爽的一步:

docker compose up -d

完事儿。

Docker 会自动拉起一整套服务:PostgreSQL、Redis、docreader、app、frontend……你就坐等几分钟,看到所有容器都显示 healthy 就 OK 了。

想看进度?

docker compose ps docker compose logs -f app

觉得核心服务太素?想加料?没问题,打开对应 profile

docker compose --profile full up -d        # 所有功能全开 docker compose --profile neo4j up -d      # 启用知识图谱(Neo4j) docker compose --profile minio up -d      # 启用对象存储(MinIO) docker compose --profile langfuse up -d   # 启用追踪(Langfuse)

支持多个 profile 自由组合:

docker compose --profile neo4j --profile minio up -d

想停?

docker compose down

Step 4:访问 Web UI,问第一个问题(30 秒)

打开浏览器,访问下面这几个地址:

服务
地址
🌐 Web UI(问答界面)
http://localhost
🔌 后端 API
http://localhost:8080
📊 Langfuse 追踪面板
http://localhost:3000

注意:v0.1.3 之后默认带登录认证,第一次访问会让你注册账号。按提示走就行。

登录进去之后的流程就简单了:

  1. 点"新建知识库" → 选类型(FAQ / 文档 / Wiki)
  2. 上传一份 PDF 或 Word 文档
  3. 等几秒钟让系统解析 + 建索引
  4. 在对话框问个问题 → 看 AI 给你生成答案 + 引用来源

恭喜,你的第一个企业级问答机器人已经上线了。

是不是比你想象的简单?说实话,比我给新手机贴膜还快。

▲ 对话设置界面:检索阈值、Prompt、模型参数都能调(来源:官方 docs/images/settings.png)


五、彩蛋模式:想改代码?千万别每次都 rebuild 镜像

这一段是给"玩机党"准备的彩蛋。

如果你打算贡献代码、做二次开发、调调内部逻辑——

千万别每改一行代码就 docker compose up --build 一次,会哭的。我当年改个路由器固件,每次刷机等 5 分钟,差点把路由器摔了。

WeKnora 官方提供了热重载开发模式,能让你改完代码 5-10 秒内看到效果:

# 终端 1:启动基础设施(数据库、Redis 这些,跟代码无关) make dev-start  # 终端 2:启动后端(Air 热重载,改完代码 5-10 秒自动重启) make dev-app  # 终端 3:启动前端(Vite 热重载,改完代码秒级刷新) make dev-frontend

这套开发模式的好处:

  • ✅ 前端修改自动刷新浏览器,不用重启
  • ✅ 后端 5-10 秒热重载(Air 工具)
  • ✅ 不用 rebuild Docker 镜像,省一杯咖啡的时间
  • ✅ 支持 IDE 断点调试

用过一次就回不去了——数码圈俗称"一旦用上热重载,再也回不去手动重启"。


六、版本演进:看看它怎么一步步长大

最后,按照数码圈"测完要聊历史"的惯例,我们来考古一下——看看 WeKnora 怎么一步步走到 v0.6.2 的。

了解历史能帮你理解它的设计选择:为什么这么做、为什么是这个 API 形态、为什么这么组织代码。

版本
关键里程碑
v0.3.0
Agent 技能 + 沙箱执行、Helm Chart、韩语 i18n
v0.3.6
ASR(音频)、飞书数据源、OIDC、IM 引用回复
v0.4.0
WeKnora Cloud、Chrome 扩展、ClawHub Skill、微信 IM
v0.5.0
Wiki 模式 GA — Agent 自动生成互联 Markdown 知识库
v0.5.2
Wiki 摄取扩至 4 万文档、MCP 人工审批、Apache Doris
v0.6.0
租户 RBAC(4 级)、AES-256-GCM、Go 1.26.0
v0.6.1
Langfuse 专属追踪、OpenSearch、声明式 YAML 内置模型
v0.6.2(当前)
每次上传的流程配置、文档重新解析、CLI v0.9、HNSW 索引

看完这张表,你会发现 WeKnora 的进化路径特别清晰:

👉 v0.3 解决"能跑"(基础功能、Agent、Helm)
👉 v0.4 解决"能用"(IM 渠道、扩展、Cloud)
👉 v0.5 解决"智能"(Wiki 模式 GA、4 万文档规模)
👉 v0.6 解决"企业级"(RBAC、加密、可观测性、HNSW)

每一步都在补一块短板,节奏稳得可怕——这更新策略,数码圈叫"牙膏厂"反向操作,挤牙膏?不,这哥们儿在"挤奶油"。


小结:这一期我们聊了啥

来,简单回顾一下:

  • WeKnora 是腾讯开源的企业级 LLM 知识框架,不是单纯的 RAG 工具
  • 三大核心能力:RAG 问答 / ReAct Agent / Wiki 模式(后两个是真正的杀手锏)
  • 技术栈:Go 1.26 + pgvector + Langfuse + Docker/Helm,全模块化可插拔
  • 5 分钟跑通:git clone → cp .env → docker compose up -d,完事儿

是不是比想象中简单?

下一期 WeKnora详解(二):知识库与对话核心能力,我们会深入聊:

  • 怎么把 PDF/Word/飞书文档接进来
  • "上传流程配置"到底是什么黑科技(v0.6.2 新功能)
  • RAG / ReAct / Wiki 三种对话模式怎么选
  • 建议问题、多轮上下文这些贴心功能怎么用

觉得有用的话,点赞、在看、转发三连,叨叨数码下期继续拆 WeKnora。

我是叨叨数码,我们下期见。#WeKnora知识分享季 #腾讯开源 #叨叨数码


🔗 项目地址:https://github.com/Tencent/WeKnora

📌 公众号:叨叨数码 · 专注 AI 工具、开源项目与数码好物拆解

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅