微信扫码
添加专属顾问
我要投稿
企业知识库图文混排升级,可视化前端一键解析,提升文档处理效率。 核心内容: 1. RAGFlow知识库图文混排功能升级,支持可视化前端页面操作 2. 文档上传解析、图片显示等流程优化,提高效率 3. 未来将围绕企业微信接入场景,进一步提升性能和准确率
上周我们团队开源了 RAGFlow 知识库支持图文混排后,有同学私信我们能不能做一个前端出来,释放双手。
企业生产环境下知识库管理者通过 可视化前端页面完成文档上传解析,并自动支持图文混排 ,效率将会大幅度提升。
文档上传完成后,在 RAGFlow 进行问答,便可以 自动显示文档里的图片 :
图文混排 整体流程如下 :
暂时无法在飞书文档外展示此内容
在之前发布的「RAGFlow 如何实现图片回答?KnowFlow 的实战方案来了(附源码)」文中,我们是内置了 MinerU 和 PyMuPDF 两种 OCR 引擎,经反复对比后 PyMuPDF 效果很差,几乎不能用。所以 OCR 引擎层面本次升级只支持 MinerU 。少即是多,提供过多的选择未必是一件正确的事, 产品层面越简单越好 。
之前方案中我们采用了 docker 独立容器部署图片服务,虽然安全性上进一步提升。但考虑到图片的存储与读取性能以及部署的复杂度,本次我们统一将图片存储到 RAGFlow 的 Minio。从设计的角度来看,也更加紧凑,复用原有的框架能力,降低复杂度。
后台管理系统新上传了文档接口,可以 实时显示文档解析的进度 。需要注意的是目前文档解析并未存储到文件系统里,上传功能并未做持久化。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-12
运维老王:创业第十年,我用Elevo找回内心翻腾的梦想
2025-09-12
大模型可观测1-5-10:发现、定位、恢复的三层能力建设
2025-09-12
Qwen3-Next:用混合注意力和高稀疏 MoE 把训练与推理成本打下来
2025-09-12
阿里推出夸克医疗大模型:医考70%高分背后,RAG为何是“压舱石”?
2025-09-12
GPT-4o-mini 调用参数终极优化手册
2025-09-12
刚刚,ChatGPT支持MCP了!一句Prompt即可全自动化
2025-09-11
阿里云,这次杀疯了,断档第一
2025-09-11
利用抽象语法树AST提升代码问答的深度与精度(下)
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-06-19
2025-06-15
2025-07-29
2025-09-08
2025-08-19
2025-08-20
2025-09-12
2025-09-11
2025-09-11
2025-09-09
2025-09-09
2025-09-08
2025-09-08
2025-09-07