微信扫码
添加专属顾问
我要投稿
今天是2024年9月11日,星期三,北京,天气阴
我们来看两个工作,一个是PdfTable工具包:深度学习在表格提取中的统一应用,另一个是大模型偏好学习综述。
这两个方案都很有趣,对于理解一些技术细节,供大家一起参考并思考。
《PdfTable: A Unified Toolkit for Deep Learning-Based Table Extraction 》(https://arxiv.org/pdf/2409.05125,代码:https://github.com/CycloneBoy/pdf_table,注注意,代码仓库还是空的)介绍了一个名为PdfTable的统一工具包,用于从PDF文件和图像中提取表格信息。
该工具包集成了多个开源模型,能够适应不同的应用场景,如处理有线表格、无线表格、数字PDF和图像PDF等。
1、 PdfTable库的设计和实现
PdfTable 由四个主要模块组成,包括布局分析、表格结构识别、文本检测与识别以及应用模块。
处理流程包括输入预处理、布局分析、表格结构识别、文本提取和应用。
2、表格解析流水线(PdfTable Parse Pipeline)
输入预处理(Input Preprocessing):
布局分析(Layout Analysis):
表格结构识别(Table Structure Recognition):
文本检测与识别(Text Detection and Recognition):
表格内容提取(Table Content Extraction):
应用(Application):
关于大模型偏好学习综述,《Towards a Unified View of Preference Learning for Large Language Models: A Survey》:https://arxiv.org/html/2409.02795v3,提供了对大型语言模型(LLM)偏好学习领域的全面概述,该供工作提出了一个统一的框架,将偏好学习策略分解为四个组成部分:模型、数据、反馈和算法。这个框架有助于深入理解现有的对齐算法,并揭示了不同策略之间的联系。
其中,在数据方面,讨论了如何收集偏好数据,包括在线(on-policy)和离线(off-policy)数据收集方法,以及这些数据如何从人类或LLM生成。
在算法方面,介绍了多种算法,包括点式(point-wise)、成对(pair-wise)、列表式(list-wise)方法,以及无需训练的对齐方法。这些算法通过不同的方式利用数据和反馈来优化LLM。
在评估方面,讨论了如何评估LLM的偏好学习,包括基于规则的评估和基于LLM的评估方法,以及这些方法的局限性。
可以重点看看一下几个图:
1、大模型偏好学习的组成
Figure 1 提供了一个关于大型语言模型(LLM)偏好学习统一视角的图示性说明。
2、大模型(LLM)偏好学习分类框架
Figure 2 提供了大型语言模型(LLM)偏好学习的一个分类框架,展示了不同组件和方法如何组合在一起。
3、偏好学习的示例
4、点式损失的偏好学习策略示例
5、偏好学习概览
要使大型语言模型(LLM)πθ与人类偏好对齐,首先需要准备偏好数据。与人类偏好对齐的环境会向偏好数据提供反馈。需要注意的是,这些反馈可以是人类标注的标签或偏好,或者是奖励模型输出的标量值。通过将模型、数据和反馈输入到特定算法中,我们获得了一个与人类偏好对齐的LLM πθ'。
6、偏好学习中模型获得的奖励说明
对于一个数据样本 (?, ?ˆ),其中 ?ˆ 是未标记的候选输出,奖励函数应该提供反馈,这可以是奖励分数 ? 或偏好标签。根据是否需要训练特定的奖励模型,奖励函数可以分为直接反馈和基于模型的反馈。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-14
浅尝一下微软的AutoGen框架
2025-06-14
基于大模型的智能运营 | 智能体式编排,业务流程管理的新阶段
2025-06-14
从Manus爆火看Agent AI的技术演进与市场变革——AI Agent全景研报
2025-06-14
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?
2025-06-14
为什么说Maus是未来任务型AI系统的代表?
2025-06-14
AI agent如何进化为天网
2025-06-14
Ollama 和 vLLM 私有化部署大模型方案分析
2025-06-14
Manus 启发下的 Agent产品设计:如何构建能思考、多步操作的 AI
2025-05-29
2025-03-20
2025-03-21
2025-04-11
2025-03-20
2025-03-19
2025-03-20
2025-03-19
2025-03-19
2025-03-19
2025-06-14
2025-06-14
2025-06-13
2025-06-13
2025-06-13
2025-06-13
2025-06-12
2025-06-12