我要投稿

CherryStudio知识库详细设置教程

发布日期：2025-04-04 11:23:56 浏览次数： 2238

作者：AI的回响

微信搜一搜，关注“AI的回响”

字数 1916，阅读大约需 10 分钟

CherryStudio知识库设置

最近，有好几位朋友问我关于CherryStudio知识库的设置问题。

虽然前面已经讨论过很多了，但是我仔细看了看，确实漏掉了一点没有说清楚，那就是知识库的参数设置问题，这一篇就再详细说一下。

新建知识库

在知识库界面选择“添加”，就会弹出添加知识库窗口。

在这里，名字可以自己设置，嵌入模型如果你不知道选哪个，可以先选bge系列。

关于如何选择嵌入模型的问题，我打算放在近期发布的《知识库优化之路（三）》里面，详细介绍。这里暂时先放一放，先继续今天的话题。

知识库设置

知识库添加完成之后，在模型信息那里，有一个设置按钮。

点击之后，就进入了知识库的设置界面。

在这里可以看到，嵌入模型是无法再更改的。这就意味着，嵌入模型只能在新建知识库时选好。

如果实在想改，唯一的做法就是删除知识库，重新创建。

除了嵌入模型，知识库可以设置的参数其实不多，下面分别介绍。

1 请求文档分段数量

这个应该很好理解吧，就是当你向大模型提问时如果添加了知识库，会有几个资料片段会和你的问题一起提交给大模型。

CherryStudio默认的设置是6段，最大值可以设置到30。

但是，这里绝不是越多越好！

因为它受到几个因素的限制。

第一，token消耗（金钱消耗）：

当你把鼠标放在问号上，就能看到CherryStudio官方的提示：请求文档分段数量越多，附带的信息越多，但需要消耗的 Token 也越多。

假如嵌入模型分段时每个片段是500个字，粗略计算按照500个token来说，30段就是15000个token。

参考DeepSeek官方价格（推理模型百万token4元），15000个token就是6分钱。

当然你的对话也不可能只进行一轮，如果是多轮对话，即便考虑缓存命中的情况，几轮对话下来，消耗几毛钱还是有的。

第二，上下文长度限制。

如果你不理解什么是上下文长度，请现在就去补课：

用一个武侠故事，讲清DeepSeek最易被忽视的一个重要使用技巧

DeepSeek-R1的上下文长度是64k，也就是64000个token。

如果你第一轮输入就使用了超过15000token，那么你的对话进行不了几轮，总的上下文长度就会超过64000个。

上下文长度超标以后会有什么后果，如果你刚才去补过课，应该能理解。

第三，API接口限制。

有些API会限制每分钟使用的token总量。DeepSeek官方API没有限制，如果你使用的是硅基流动提供的DeepSeek接口，那就要注意了。

硅基流动官方对于普通版DeepSeek-R1的限制是TPM值 10000，也就是每分钟最多使用10000个token。（Pro版DeepSeek-R1每分钟100万个，可以放心使用）

如果你提问时附带的资料就有15000个token，你猜你的问题还能成功发出去吗？

至于其他平台的API是否有这个限制，我暂时还没了解，大家实际使用时可以留意一下。

第四，匹配度的限制。

即便前面说的三个问题都不存在，也不是你想附带多少个片段都行的，因为还要考虑匹配度的问题，也就是下面要详细说的第二个参数。

2 匹配度阈值

我之所以没有按照设置界面从上玩下依次介绍，而是把匹配度阈值放在第二个说，就是因为它和上一个参数（请求文档分段数量）一起，决定了最终大模型能收到几个片段。

匹配度阈值也很好理解，它就是一个筛选标准，只有匹配度高于某个百分比的片段才有资格被提交给给大模型。

CherryStudio官方可能没有设置默认值，不过据我观察，有些匹配度只有30%多的片段也能被搜到，这种其实已经没有了参考价值。

这个参数的设置范围是0到1，0.1就是10%，0.5就是50%，1就是100%。这个相信大家都能理解。

一般情况下，匹配度阈值设置在70%（也就是0.7）比较合理。

但是，如果你的知识库资料不够多，设置70%可能导致一条都匹配不到。这时候可以适当降低标准，设置成60%或者50%。再低，参考价值就不高了，只会浪费token。

所以，因为有匹配度阈值，请求文档分段数量这个参数并不能完全决定最终提交给大模型的片段数量，而是它们两个共同决定的。

有些情况下，可能匹配到了10个符合匹配度阈值的片段，但是请求文档分段数量设置是6个，那就只选匹配度最高的6个提交给大模型。

有些情况下，虽然设置的请求文档分段数量设置是10个，但是只匹配到了3个符合匹配度阈值的片段，那就只把3个片段提交给大模型。

3 分段大小

分段的问题，之前已经介绍过，相信大家都已经理解了。不理解什么是分段、为什么要分段的朋友，继续补课：

泼冷水：CherryStudio+本地知识库，没你想的那么简单

分段大小指的就是每个片段的字数多少。这个参数，官方不建议修改，我也不建议修改。

因为分段太大，信息虽然可能更完整，但也可能附带一些无用的信息，影响大模型分析判断。

分段太小，搜索命中可能更精准，但也可能丢失一些信息，导致大模型判断不准。

很多嵌入模型会有一些智能化的算法，根据不同的文件类型和内容，自动调整片段长度。

另外，不同的嵌入模型，对于每个片段的长度要求也是不一样的。如果你设置的分段大小超过了嵌入模型的最大值，嵌入时必定会出问题。

所以，分段大小这个参数建议不要自己设定。

4 重叠大小

重叠大小，和分段大小也有关系。

如果分段时过于简单粗暴，只是按照500每段的长度直接拆分，可能有很多句子、段落都会被从中间直接拆断，造成信息不完整。

为了解决这个问题，就允许相邻的两个片段，结尾和开头部分，有一定的内容重复，也就是重叠，这样就能减少有些句子被拆分的可能，在一定程度优化分拆效果。

在CherryStudio里，如果你想设置重叠大小的数值，那你就必须先设置分段大小。

因为刚才我们并不建议自己设置分段大小，所以，重叠大小这个参数，也不建议自己设定。

既然这两个值都没有设置，那也就可以忽略官方的提醒“分段大小和重叠大小修改只针对新添加的内容有效”。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-30

62k star！一个让复杂文档“开口说话”的智能引擎

2025-07-29

AGI｜知识治理：直击知识库知识质量与精准检索痛点

2025-07-29

AI 如何让数据管理效率提升 10 倍？

2025-07-29

企业利用AI构建知识库是否为伪需求？

2025-07-27

AI知识库系列：对比传统知识库，帮你 3 步搞懂 AI 知识库 RAG，彻底搞清两者的本质区别！

2025-07-26

AI重构组织｜部门墙终将消失，孤岛终将合一

2025-07-26

腾讯文档藏了个AI知识库，AI帮我秒搜资料、提炼总结、回答问题（附激活方法）

2025-07-25

会话存档为什么比工作手机更适合企业？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

AI知识库之腾讯 IMA Copilot：最新功能与高阶用法深度解析

2025-07-15

「这才是懂你的AI知识库」——飞书发布会捞干货，详细拆给你听

2025-07-15

对不起腾讯ima，Get笔记在碎片知识管理上真的太香了！

2025-05-12

Obsidian高效知识库实践：精简、链接与混沌中的秩序

2025-05-28

为什么Data Agent将成为企业未来三年胜负手？

2025-05-07

AI大模型在县级纪委监督中的应用场景浅析

2025-05-25

腾讯IMA知识库：AI赋能的高效知识管理神器

2025-06-15

用飞书做知识管理的含金量还在上升

2025-05-22

MCP最新企业级权限认证方案，STDIO/SSE不同实现详解！

2025-05-21

飞书知识问答｜企业级知识管理进入AI时代

2025-05-26

大家都在问

AI 如何让数据管理效率提升 10 倍？

2025-07-29

企业利用AI构建知识库是否为伪需求？

2025-07-29

会话存档为什么比工作手机更适合企业？

2025-07-25

AI知识库系列之一：AI知识库到底解决了什么问题？适合谁？怎么用？

2025-07-15

AI 产品经理，如何搭建企业级，大模型知识库问答系统评估体系？

2025-07-12

如何真正做出有价值的AI知识库？

2025-07-02

AI知识库落地：真能降本提效？

2025-07-01

“结果付费”能救企业软件？

2025-06-26

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB