支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Coze开源后,我用LLM+OCR做了一个文档智能问答Agent

发布日期:2025-07-31 11:53:24 浏览次数: 1536
作者:PaperAgent

微信搜一搜,关注“PaperAgent”

推荐语

Coze开源助力企业高效搭建文档问答Bot,结合LLM与OCR技术实现精准信息提取。

核心内容:
1. Coze平台零代码搭建文档问答Bot的实用价值
2. LLM与专有模型协作提升文档解析精度的技术方案
3. 从创建到配置的完整工作流搭建教程

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
近期Coze开源的消息刷爆了朋友圈,这对于想通过搭建Agent解决复杂问题的企业开发者而言简直是超大好消息!通过Coze平台,企业用户可以通过零代码或低代码的方式,快速搭建出解放生产力的AI工作流,辅助员工高效完成各类的复杂任务。
今天,我就来分享一个用Coze搭建文档智能问答Bot的保姆级教程
图片
图片来自扣子官方
我们经常会遇到从产品手册、技术白皮书、合同条款、内部报告……等文档中快速精准地提取所需信息的情况,这时可靠的文档智能问答Bot就能成为我们的得力助手。
文档智能问答机器人能够将静态文档转化为动态知识库,比起原先埋头文档中靠自己阅读记忆,现在我们只需向Bot提问,它就能快速定位并输出文档中相关的精确答案或关键段落。例如:
  • 合同审核:面对冗长的合同,直接询问“付款周期是多久?”或“违约责任条款有哪些?”,Bot能迅速给出答案,省去逐页查找的麻烦。
  • 技术支持:新员工面对复杂设备手册,问“如何重置设备密码?”或“错误代码XX代表什么?”,Bot能立即提供操作步骤或故障解释。
  • 知识检索:在海量的产品文档或研究报告中,提问“报告中关于市场趋势的主要结论是什么?”,Bot能快速定位核心信息并组织语言回答。
尽管直接使用大模型也能进行基础的文档问答,但是,LLM的强大之处在于其卓越的自然语言理解、推理和生成能力,能理解复杂问题、联系上下文甚至进行总结归纳,在文档问答任务的前端环节——特别是光学字符识别(OCR)准确提取扫描件/图片中的文字,以及精准解析复杂PDF结构(如表格、多级标题、页眉页脚)等方面——LLM的精度往往难以匹敌经过专门训练和优化的专有模型。
以下图为例,可以看到LLM和专有模型在扫描件少线表格这一难点上的解析能力差异:
因此,构建一个真正高效、可靠的文档问答Bot,关键在于发挥LLM与专有模型的各自优势,实现协作:利用专有模型高精度完成OCR和文档结构解析,确保原始文本信息被完整、准确地提取;然后将清洗后的文本输入LLM,利用其语义理解和推理能力,精准理解用户问题并从文档上下文中找出或生成最佳答案。
样本原图
样本原图
LLM直接问答 VS. TextIn专有模型解析后问答
LLM直接问答 VS. TextIn专有模型解析后问答
接下来,本文将一步步演示如何在Coze平台上,搭建一个融合专业文档处理能力与LLM智能的文档问答Bot工作流。让我们开始,利用AI工具,让文档中的知识真正“活”起来,服务于你的日常工作。
Step 1:创建智能体
工作空间 -> 项目开发 -> 创建 -> 创建智能体 -> 创建 -> 输入项目名
图片

Step 2:创建工作流

工作流 -> 添加工作流

图片

创建工作流 -> 输入工作流名称和描述

图片
图片

Step 3:工作流配置

添加“插件”

图片

搜索“TextIn” -> 找到“pdf2markdown” -> 添加

图片
图片

Step 4:模块设置

1. 开始模块

类型设置 ->  input = File.Default

图片

2. 解析模块

类型设置

  • url = 开始.input
  • app_id = Textin.com账号信息,请注册https://cc.co/16YSVU或登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-app-id
  • secret_code = Textin.com账号信息,请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-secret-code
图片
Textin.com 获取 app_id和secret_code信息填入
图片
模块输出指向 -> 大模型
图片
3. 大模型模块

大模型 -> 选择 DeepSeek

图片

设置输入参数 -> pdf2markdown -> markdown

图片

输入系统提示词“请根据{{input}}进行内容总结”

图片

4. 结束模块

设置输出 -> 大模型 -> output

图片

Step 5:试运行发布

点击“试运行” -> 上传测试文件 -> 发布

图片

Step 6:添加工作流,开始问答

图片
图片
图片
图片





53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询