支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


硬核进化!BISHENG 1.3.0 发布:用实力,定义企业级知识库的“好用”

发布日期:2025-06-21 13:46:02 浏览次数: 1533
作者:毕昇 BISHENG

微信搜一搜,关注“毕昇 BISHENG”

推荐语

毕昇1.3.0版本重磅升级,企业级知识库迎来硬核进化!三大核心能力全面提升,让文档解析更智能、交互更流畅、工作流更稳定。

核心内容:
1. 智能解析引擎:原生支持多格式文档解析,精准识别各类文件结构
2. RAG问答优化:实现图文并茂的检索结果展示,提升知识检索体验
3. 工作流增强:解决超时中断问题,优化跨环境导入流程,确保稳定性

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


大家好呀,我是BISHENG产品团队的Ziye,今天我们非常激动地宣布,毕昇1.3.0 版本现已正式发布!本次更新是毕昇平台在文档解析能力、交互体验和性能方面的一次全面升级,以下为新版本核心亮点:


 1 知识库解析与RAG问答能力优化:全面优化文档解析策略,支持图文并茂的RAG问答。

 2 知识库性能与交互优化:文件上传中的智能处理,优化上传流程多项交互细节,打造更流畅的用户体验。

 3 工作流体验增强:解决超时中断问题,优化跨环境导入流程,确保工作流运行的稳定性和便捷性。

 4 工作台功能拓展:引入更多搜索引擎,支持自定义系统提示词,赋予用户更大的灵活性和控制力。


01.

硬核进化:

知识库能力全面升级,文件解析效果全面提升


区别于市面其他友商,BISHENG对于文档解析一直有着自己的一套思路,我们基于自研强大OCR能力,将所有文件都转成pdf文件,最后再通过OCR进行解析,在初期也取得了很好的成效:我们对于pdf类型文件的解析能力一直处于业界领先的地位,也带来了溯源定位,交互式修改等等开创性的功能。

然而,这样“一刀切”的方案,在拥抱多元化文档格式时,逐渐显露出束缚。面对 Excel、word、Markdown 等结构化文件,格式转换过程可能会失败;即使是转换成功的文件,也会伴有信息损失或格式失真。

新版本,我们决心重构文件解析方案,破茧而出!


 1.1. 

智能解析引擎:

多格式原生解析,拥抱精准识别


1.接入ETL4LM: 新版本支持接入ETL4LM,这是我们自研OCR的最新版本,新增包括多栏版式识别、图片检测、公式识别等多项文档解析能力,显著提升对文档整体结构的识别准确性。




2.多格式原生支持: 现在, TXT、DOC/DOCX、Markdown、PPT/PPTX、HTML等文件无需再转换为PDF,可直接进行原生解析;对于PDF扫描件和图片文件,用户可选择是否使用ETL4LM进行解析。不同文件采用不同处理方案,显著提高文件解析效果。


注:ETL4LM为可选部署,需要授权,我们为每家公司/组织提供 1卡 免费授权。详见BISHENG在线文档《毕昇可选组件部署》。


 1.2. 

RAG问答图文并茂:结果呈现丰富多彩


1.保留文档中的图片信息:针对用户在问答场景中对图片内容的需求,新版本支持从各类文件中提取图片内容并存储到服务器本地。然后以 Markdown格式(![image](路径.png))保存图片在当前分段中。



2.RAG问答图文并茂:在RAG过程中,如果检索到的分块包含图片,大模型自行判断关联度后会将使用Markdown语法输出图片链接(![image](路径.png)),前端会渲染为图片展示。


注:需配合提示词中引导大模型输出图片url,BISHENG工作流的[知识库问答]节点默认提示词以更新,若老的节点可以参照进行修改。



 1.3. 

知识库文件上传交互优化:

更精细的操作,更丝滑的体验


1.文件入库流程重构:文件入库流程优化为四个步骤:“文件上传”——“分段策略”——“原文对比”——“数据处理”


2.文件上传体验升级: 优化了构建知识库的进度展示,让用户清晰了解处理状态,并提供了删除和重新上传功能,并且系统将自动识别文件是否重复或超过大小限制,让文件管理更加灵活。


3.分段策略精细化: 提供了更灵活的文档处理策略页面,对文本文件 (包括TXT、DOC/DOCX、Markdown、PPT/PPTX、HTML)和表格文件 (包括CSV、XLS、XLSX) 进行更精细的切分设置,例如对于表格文件:“每n行作为一个分段”,并支持为分段添加表头,确保知识切分的准确性和可用性。


切分结果示例
原始表格


4.原文对比修改:新增原文对比界面,用户可以进行Markdown预览、删除分段、编辑文字区域,对于pdf文件可以定位到原文件中的对应位置,极大地提升了知识校对和编辑的效率。


5.可视化数据处理新增文件入库处理进度展示,让用户清晰了解处理状态,并且支持一键创建一个基于该知识库的问答工作流,提升用户体验。


6.摘要提示词可编辑: 知识库摘要功能现在支持用户自定义编辑提示词,预置了专业的“文档摘要专家”提示词,让知识摘要更符合您的个性化需求。


0.2.

工作流引擎升级:稳定高效,跨越环境


 2.1. 

线程资源优化:告别超时中断,持续对话无忧


毕昇 workflow 因为其“有状态”的特点,需要有一套线程管理机制,过去的管理策略比较简单,因此增加了workflow 线程等待输入时间超时限制。

在本次迭代中,我们优化了 workflow 线程管理机制,避免了“工作流等待用户输入超时”问题,带来流畅的对话体验。


 2.2. 

跨环境导入工作流文件优化:

模型、知识库自动适配


在跨环境导入工作流文件时,由于不同环境的模型、知识库不一致,过去在导入文件后直接运行会出现报错情况,在 1.3.0 版本中我们增加了跨环境导入时自动替换节点模型、清空节点知识库配置等逻辑,确保了工作流在不同环境中的兼容性,避免因配置差异导致的运行错误。


0.3.

工作台功能拓展:更开放,更个


毕昇工作台的定位是未来的企业内 AI 应用门户,在1.3.0 版本中对其功能进行了拓展,提供了更开放、更个性化的使用体验。


1.更多搜索引擎集成: 由于 Bing 官方搜索服务即将下线,我们新增了对博查Web Search、Jina深度搜索、SerpApi和Tavily等主流搜索引擎的支持,让您的AI应用能够获取更广泛、更精准的外部信息。


2.系统对话提示词自定义: 对话模型管理模块现在支持用户自定义系统提示词,您可以根据具体应用场景,为AI赋予不同的“人设”和行为模式,实现更灵活的对话控制。


3.知识库解析策略统一: 工作流输入节点和工作台上传文件的解析方式将复用本期文档知识库的默认解析方法,不再使用原有转PDF方案,确保了平台内知识处理的一致性和高效性



写在后面  

BISHENG1.3.0重塑了整个知识库上传解析的流程,对于BISHENG平台是一个相当大的改动了,中间必定会有很多的困难:太多边界情况的考虑、各个新功能对于旧文件的支持、本次改动是否带来正向的用户价值(用户价值=新体验-旧体验-替换成本),破茧的过程十分艰苦,希望最后的成果能为大家带来更好的体验!




👋

#BISHENG 是一款开源 LLM 应用开发平台,主攻办公场景。

  • 我们开放诚恳、长期主义、关注业务价值、不炫技。

  • 我们希望帮助企业真正实现智能化落地,让中国企业用上好软件。

  • Github点亮⭐️:https://github.com/dataelement/bisheng

  • 欢迎大家扫码进BISHENG社群,与我们交流。



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询