我要投稿

我开源了 PPT-Library：让历史 PPT 变成 AI 可复用资产

发布日期：2026-06-08 20:45:18 浏览次数： 1519

作者：臧青内容智能

微信搜一搜，关注“臧青内容智能”

AI 落地 · 开源项目

我开源了 PPT-Library：让历史 PPT 变成 AI 可复用资产

PPT Library 是一个本地优先的 PPT 资产库 CLI，把历史 PPT 按页转成可检索、可预览、可复用、可被 Agent 调用的资产，让 AI Deck 生产从生成新页面走向调用历史经验。

臧青 · 2026-06-07 · GameStarted. Life

过去几年，AI PPT 最热闹的方向，基本都围绕一个问题展开：

怎么更快生成一套新 PPT。

我越来越觉得，这只解决了后半段。

真正更大的价值在前面：

过去几年写过的那些 PPT，能不能重新进入 AI 的工作流？

如果历史里已经有一页讲得顺、客户认可过、在多个项目里反复使用过的架构图，AI 为什么还要每次从零生成一张？

如果同一页被十几份方案引用过，为什么它还只是压在文件夹里的旧页面？

如果一页 PPT 曾经帮你赢过单，它就不该只停留在历史归档里。

它应该继续工作。

今天开源的 PPT Library，解决的就是这个问题。

项目地址：https://github.com/MainQuestAI/PPT-Library

我更愿意把它叫做 AI Deck 生产链路里的资产基础设施。

它解决的是 AI PPT 从“生成新页面”走向“调用历史经验”的关键缺口。

前面开源的PPT-Deck-Pro-Max，解决的是“进入页面构建之前，先把商业 Deck 的内容讲对”。

这一次的 PPT Library，解决的是另一个更底层的问题：

你过去做过的那些 PPT，到底能不能被 AI 找到、看懂、筛选、复用，并且继续沉淀成资产？

我做 PPT 做了很多年，一个很真实的感受是：很多公司其实并不缺 PPT。

它们缺的是可用的 PPT。

几十个项目文件夹，上百份方案，几千页历史材料，散落在本地目录、网盘、聊天记录、历史归档和各种版本备份里。你明明知道以前做过类似页面，但真要找的时候，经常只能靠文件名猜，靠记忆翻，靠运气搜。

更麻烦的是，当 AI Agent 进入这件事以后，问题会被放大。

人至少还记得“以前那套行业方案里有一页架构图不错”。AI Agent 没有这种记忆。你让它做一套新方案，如果它无法稳定访问历史页，它就会从空白开始生成。结果通常是：看起来完整，但少了历史项目里的真实结构、真实案例、真实表达密度和真实业务语感。

这就是我开源 PPT Library 的原因。

我不想让 AI 每次都从空白页开始做 PPT。

我希望它能先进入一个本地 PPT 资产库，查一查历史里有没有已经被证明好用的页面，再决定是复用、改写、重组，还是重新生成。

一、市面上早有人在做 PPT 管理

我调研了一圈，市面上已经有一些成熟的商业产品在做 presentation management、slide library、brand content management 这类事情。

比如 Shufflrr，它强调企业级 PowerPoint presentation management，把混乱的文件变成可访问、可组织、可复用的内容，并且有品牌一致性和合规管理。

比如 SlideHub，它强调 approved slides、AI search、PowerPoint 内置使用、权限与合规，让销售、咨询、投标团队可以更快找到公司已经批准过的页面。

再比如 Templafy，它的主线更偏 document generation、brand control、模板管理、合规内容和 Microsoft Office 工作流，把企业文档生产纳入品牌和规则控制。

这些产品的存在，恰好说明一个事实：

PPT 管理本身就是一个真实需求。

尤其在咨询、售前、投标、专业服务、品牌和市场团队里，PPT 不只是文件格式，它是业务表达、销售材料、品牌一致性和组织经验的一部分。

但我做 PPT Library 的切入点和这些商业产品不完全一样。

商业 presentation management 产品通常面向公司级部署，重点放在统一模板、品牌合规、权限管理、云端内容库、Office 插件、团队采纳和企业级治理。

PPT Library 的起点更窄，也更适合 AI Coding 和个人开发者工作流：

本地优先、开源、CLI 驱动、Agent 可调用，把 PPT 拆成页级资产。

它不试图替代企业级品牌管理平台。

它优先解决的是另一个问题：

当一个 AI Agent 要帮你做新方案时，它能不能稳定回答：

历史里有没有相关页面？
这页来自哪一份 PPT？
它是第几页？
有没有截图可以预览？
有没有相似版本和代表版本？
这页是否值得复用？
它过去有没有被用于其他方案或机会？

这些问题如果答不出来，AI 做 PPT 就很难真正利用历史经验。

所以 PPT Library 的价值，不在“又做一个企业 PPT 管理系统”。

它更像是给 AI Deck 生产链路补了一个本地资产入口。

二、通用知识库为什么吃不透 PPT？

另一条常见路线，是把 PPT 上传到知识库。

这几年很多人都会这么做：把 PDF、Word、PPT、网页、Markdown 一起丢进 Dify、AnythingLLM、LlamaIndex、LangChain 或类似系统里，然后让 AI 基于知识库回答问题。

这条路线当然有价值。

比如 Dify 的知识库会把文档预处理、切分成 chunks，再按检索设置返回相关片段。

LangChain、LlamaIndex 这类框架也有 PPTX reader 或 loader，可以从 PowerPoint 里抽取文本、图片说明和幻灯片内容。

如果目标只是问答，这已经够用。

你问：“这个方案里有没有讲实施路径？”

知识库可能会返回一段相关文本，告诉你某个 PPT 里有相关内容。

但如果目标是“做 PPT”，这就不够了。

因为 PPT 的价值并不只在文本片段里。

它还在页的位置、页的截图、页的布局、页和其他页的关系、同一页被复用了多少次、它出现在什么项目里、哪个版本更值得看，以及它能不能直接进入新 Deck 的组装流程。

通用知识库通常会把 PPT 处理成“可问答的内容块”。

PPT Library 要处理的是“可复用的页面资产”。

这中间差了几件关键事。

第一，通用知识库返回的是片段，你经常只能知道“这段话来自某个 PPT”。但做方案时，你需要知道它具体是哪一份 PPT、哪一页、截图长什么样，必要时还能打开原文件。

第二，通用知识库更关心语义相关性。PPT Library 还要关心页面角色，比如这页是架构页、案例页、价值页、流程页，还是方法论页。

第三，通用知识库通常不维护 PPT 版本家族。真实工作里，同一个项目可能有很多版，搜索结果如果被 v3、v5、终版、最终版反复刷屏，使用体验会很差。

第四，通用知识库通常不知道复用关系。某一页被多少份 PPT 引用过，在哪些项目里出现过，有没有进入赢单方案，这些信息对资产经营很关键。

第五，通用知识库的终点是“回答问题”。PPT Library 的终点可以继续往后走：导出审查包、记录 usage、生成组装计划、把候选页交给 Agent 进入新 Deck。

这就是 PPT Library 和普通知识库最核心的差异。

通用路线把 PPT 当成一份可问答文档。

PPT Library 进一步把 PPT 当成一组可以被定位、预览、复用、追踪和重新组装的页面资产。

三、PPT 的最小复用单位，其实是“页”

很多人管理 PPT，习惯按文件管理。

比如“某某客户方案.pptx”“产品介绍终版.pptx”“年度汇报 v7.pptx”。

这种方式适合人打开文件，但不适合资产复用。

因为真正会被反复复用的，往往是其中某一页，而非整套 Deck。

一页架构图。

一页流程图。

一页价值矩阵。

一页客户案例。

一页竞品对比。

一页实施路径。

一页管理层能看懂的总览页。

做方案的人都知道，一套 40 页 PPT 里，真正能被下一个项目复用的可能只有 3 到 5 页。但这几页一旦找得到，就能省掉很多重复劳动，也能明显提高新方案的质量。

所以 PPT Library 从一开始就按“页级资产库”设计。

它会把 PPTX 按页入库，抽取每一页的文本、截图和索引信息，让你可以按一页一页来搜索、审查和复用。

这件事听起来很朴素，但它是 PPT 资产化的起点。

如果没有页级索引，PPT 永远只是一个个文件。

有了页级索引，PPT 才有机会变成可调用的资产。

四、它真正解决的是“找可复用页面”

PPT Library 是一个本地优先的 PPT 资产库 CLI。

它的核心能力包括：

第一，页级搜索。

你可以搜索“组织架构图”“年度路线图”“产品对比矩阵”“实施计划”“风险控制清单”这类需求。系统会按页返回结果，而非只告诉你哪个文件可能相关。

第二，截图预览。

PPT 远远超过纯文本材料。很多页面的价值在布局、结构和视觉关系里。PPT Library 会尽量生成页面截图，并提供 HTML 审查页，让人和 Agent 都能看到结果长什么样。

第三，版本治理。

真实项目里，一套 PPT 经常有十几个版本。v3、v7、终版、最终版、最终最终版，这些文件如果全部平铺在搜索结果里，噪音会非常大。PPT Library 会把相似文件归入同一个 family，默认优先展示代表版本，需要时再展开历史版本。

第四，Deck 理解。

它可以补充整份 PPT 的项目、行业、场景、章节结构和摘要信息，让检索不只依赖某一页的字面文本。

第五，关键页识别。

有些页面天然更值得复用，比如架构页、方法论页、客户案例页、价值总览页。PPT Library 可以生成 key pages 候选，让你优先审查高价值页面。

第六，复用和战绩追踪。

如果某一页经常被用在赢单方案里，它的价值应该被记录下来。PPT Library 支持记录 deal、记录页面 usage，并在搜索结果里展示复用次数、赢单次数和业务排序信号。

第七，Agent 友好。

它提供 JSON 输出，也内置了 ppt-library Skill，方便 Codex、Claude Code、Hermes、OpenCode 这类 Agent 稳定调用，避免 Agent 自己去翻文件夹、猜路径、解析一堆混乱结果。

这些能力放在一起，PPT Library 做的事情很明确：

把历史 PPT 从“文件归档”推进到“页面资产库”。

五、为什么一定要本地优先？

PPT 是一种很敏感的材料。

售前方案里有客户名、业务痛点、报价倾向、竞品判断、实施路径、组织信息。

管理层汇报里有战略判断、财务指标、项目状态和内部决策。

投标材料里有方案策略、差异化表达、历史案例和供应商应答口径。

这些东西不适合默认丢到一个远程服务里。

所以 PPT Library 采用本地优先。

SQLite 索引库、PPT 页面截图、搜索 HTML 预览、组装清单和本地产物，默认都放在用户本机的~/.ppt-library/ 里。

模型能力也可以走本地方案，比如 LM Studio 或 Ollama。没有模型服务时，它仍然可以做基础文本抽取和关键词搜索；配置 embedding 后，再升级成语义检索。

这套设计的目标很简单：

让个人开发者、方案顾问、售前团队和 AI Agent 能够安全地使用历史 PPT，避免为了“智能检索”先牺牲资料边界。

公开仓库里也不包含真实 PPT、真实客户资料、样本截图或本地数据库。

这次开源，我更希望它成为一个可以被放心试用的基础工具。

六、让 AI Agent 拥有干净的 PPT 资产入口

PPT Library 对我最重要的价值，不只在于给人搜 PPT。

更关键的是给 AI Agent 一个稳定、干净、可控的资产入口。

过去我们让 Agent 做 PPT，经常会遇到一个问题：它没有历史工作环境。

你给它一个任务，它可以生成新内容。

但它不知道你过去做过哪些方案。

它不知道哪些页面被客户认可过。

它不知道哪个架构图已经讲顺了。

它也不知道哪些版本是废稿，哪些版本才值得参考。

结果就是，每一次 Deck 生产都像从零开始。

PPT Library 可以改变这个起点。但前提是，这个资产入口必须先被治理干净。

我自己踩过一个坑。

一开始，我也很自然地想“尽量多扫一点 PPT”。

后来发现，这个思路很危险。

因为本机里不只有高价值方案。

还有 WPS 备份、回收站、Downloads、聊天软件缓存、临时输出、历史废稿、Python 模板、重复版本和各种低质量文件。

如果把这些东西全部塞进索引库，结果会很糟糕。

搜索噪音变多，重复文件挤占候选位，建库成本上升，隐私风险也随之上升。Agent 拿到这样的库，也很难判断哪一页真正值得复用。

所以 PPT Library 的公开版把首次建库入口改成了更克制的方式：

先生成sources manifest，只写入用户确认的高价值路径。

再执行 sources scan --dry-run，预览将要扫描的 PPT。

确认无误后，再 sources scan --apply 和index --from-sources。

默认建议只纳入四类资料：

核心方案库。
当前项目资料。
历史归档目录。
1 到 3 份最能代表你风格和业务方向的基准 PPT。

微信、企业微信、WPS、Downloads、回收站、缓存目录、依赖包目录和临时输出目录，默认都不应该进入长期 PPT 库。

这一步看起来保守，但我认为它非常重要。

资产库的价值，不取决于塞进去多少文件，而取决于候选页面是否值得被再次使用。

Agent 可以先用 JSON 搜索历史页，读取页面标题、文本片段、截图路径、页面角色、重要性分、复用记录和战绩信号。

它可以先提出候选页清单，交给人审查。

它可以把某些页面作为“可复用页”，把另一些页面作为“改写参考”，再把缺口页交给 PPT-Deck-Pro-Max 或其他 build 型 Skill 继续生成。

这意味着，AI 做 PPT 的流程可以从“凭空生成”进入“检索、判断、复用、补缺、组装”的工作流。

这才更接近真实方案人的工作方式。

七、从页面复用，到资产经营

PPT Library 公开版 v1.4.0 的重点，是 PPT 资产经营闭环 v1。

这个说法听起来有点重，但意思很简单：

一页 PPT 值不值得复用，不能只看它有没有关键词命中。

还要看它是否属于关键页。

看它有没有被人审过。

看它在哪些机会里被用过。

看它有没有出现在赢单方案里。

看它适合哪个行业、哪个场景、哪种叙事角色。

所以 v1.4.0 增加了几类能力。

ppt-lib insights key-pages可以列出可复用关键页候选。

ppt-lib insights review-pack 可以导出 JSONL 审查包，方便人或 Agent 批量复核页面标签。

record-deal可以记录机会描述、行业、场景、标签和赢输结果。

record-usage 可以记录某页在哪个机会里被使用。

搜索结果里会展示page_role、importance_score、importance_reason、needs_visual、reuse_count、won_count、lost_count和 win_rate 这些信号。

当然，公开版不会凭空知道你的真实战绩。

这些业务排序信号需要你自己慢慢录入、修正和积累。

但这个方向很重要。

因为真正有价值的 PPT 资产库，最后一定会从“能搜到”走向“知道哪页更值得用”。

八、它和 PPT-Deck-Pro-Max 的关系

我现在越来越把 AI Deck 生产拆成三层。

第一层，是内容生产层。

也就是 PPT-Deck-Pro-Max 做的事情：把有限输入、专家判断、资料整理、叙事弧线和逐页规格组织成一套生产包。

第二层，是资产检索层。

也就是 PPT Library 做的事情：从历史 PPT 中找到可复用页面、关键页、案例页、架构页和已经有业务记录的页面。

第三层，是页面构建层。

可以是 PPTX，可以是 HTML，可以是图片型 PPT，也可以是其他 build 型工具。

这三层连起来以后，AI 做 PPT 就不再只是“输入一句话，生成几页图”。

它会更像一个真实的方案生产系统：

先理解需求。

再检索历史资产。

再补齐内容缺口。

再设计叙事和逐页规格。

再组装和生成页面。

最后审查、返工、记录复用结果。

这个链路里，PPT Library 是资产底座。

没有它，AI 很容易变成一次性页面生成器。

有了它，历史材料才有机会继续进入新方案、新项目和新 Agent 工作流。

九、现在公开版能做什么？

当前公开版是 v1.4.0。

它是一个 source-install first 的开源预览版本，项目采用 Apache License 2.0。

你可以从源码安装，然后按 Quick Start 完成初始化、资料源清单、dry-run、建库、搜索和 HTML 预览。

第一次使用时，我建议先用少量 PPT 验证流程，再扩大到完整方案库。

公开仓库里也准备了合成 demo。

你可以生成 3 份不含真实客户资料的合成 PPT，演示从建库、关键页识别、审查包导出、战绩录入、复用追踪，到业务排序搜索的完整闭环。

这次发布前，我也跑了完整 release check。

检查项包括工作区状态、远端仓库策略、敏感文件类型、私有关键词、版本元数据、自动化测试、代码检查、类型检查、构建和合成 demo smoke。

当前自动化测试基线是 518 条。

release check 已通过，合成 demo 也完成了关键页、review pack、usage tracking 和带截图的搜索 HTML 验证。

这些验证不代表它已经是一个大型商业产品。

但它说明了一件事：这个公开版已经可以作为一个可安装、可验证、可继续迭代的开源工具起步。

十、它适合谁？

PPT Library 最适合三类人。

第一类，是长期做方案、售前、咨询、产品介绍、投标材料的人。

你手里有大量历史 PPT，但缺少一个按页复用的资产库。

第二类，是正在使用 AI Coding 和多 Agent 工作流的人。

你希望 Agent 每次写方案之前，先看历史资产、再做判断，而非直接从空白开始。

第三类，是已经在做 PPT 自动化的人。

你可能已经有生成 PPT、HTML、图片型 Deck 的能力，但还缺少一个上游资产入口，让历史页面能进入新流程。

如果你只是偶尔改一两页 PPT，直接用现有编辑工具就够了。

PPT Library 更适合那些需要长期沉淀方案资产、复用历史页面、让 AI Agent 参与 Deck 生产的人。

十一、为什么开源？

原因还是很个人。

我曾经非常依赖 PPT 工作，也非常清楚 PPT 对方案人意味着什么。

PPT 远远超过简单的办公文件。

它承载的是一个人或一个团队对业务问题的理解、表达、说服和推进能力。

很多公司过去几年积累了大量 PPT，但这些 PPT 大多停在“历史归档”的状态。

人找不到。

AI 看不懂。

页面无法被稳定复用。

好页和废页混在一起。

赢单经验也没有真正沉淀下来。

这太浪费了。

我希望 PPT Library 能把这些历史材料重新激活。

先从最朴素的事情开始：按页入库，安全扫描，语义搜索，截图预览，版本治理，关键页识别，复用追踪。

然后再慢慢进入更高级的事情：业务排序，Agent 审查，自动组装，和更完整的 Deck 生产流。

PPT-Deck-Pro-Max 解决“新 Deck 怎么被讲对”。

PPT Library 解决“旧 Deck 怎么被重新用起来”。

两者连起来，就是我理解中的 AI Deck 生产基础设施。

我开源它，是希望更多做方案、做售前、做咨询、做产品叙事、做 AI Agent 工作流的人，可以不再把历史 PPT 当成死文件夹。

那些曾经帮你说服客户、推动项目、赢下机会的页面，应该继续工作。

如果你看到这里，也觉得这件事有价值，甚至觉得它应该继续发展成一个商业化产品，也欢迎来找我聊。

开源版会继续按当前 Apache License 2.0 使用；如果你需要企业级部署、私有化改造、团队版能力、商业产品集成，或者希望有更清晰的商用授权和合作边界，也可以直接联系我。

这件事后面可能有两种路径：我自己继续把它做成商业化产品，或者和真正有场景、有资产、有客户需求的团队一起讨论商业授权和合作方式。

十二、彩蛋：真正的高频场景还在后面

写到这里，其实还有一个更大的问题。

如果 PPT Library 解决的是历史页面如何被重新调用，PPT-Deck-Pro-Max 解决的是新 Deck 的内容和叙事如何被讲对，那么下一步是什么？

下一步，就是把这两件事放进同一个真实任务里。

因为在真实工作中，我们很少真的从一张空白页开始，把每一页都重新生成。

做一套商业方案，通常是几件事同时发生：

你要围绕新的客户、新的命题、新的业务目标，重新搭一套完整叙事。

你也要从历史方案里找出已经证明有效的架构页、案例页、方法论页、价值页和实施路径页。

你还要判断哪些页面可以直接复用，哪些页面适合改写，哪些页面只能作为参考，哪些页面必须重新生成。

最后，这些内容要被组织成一套完整输出，不能停留在一堆零散候选页。

这才是我认为 AI 做 PPT 最常见、最高频、也最有价值的场景：

一边生成新的叙事，一边调用历史资产，最后组装成一套完整解决方案。

这个任务不能只靠 PPT Library 完成。

PPT Library 负责告诉你：历史里有哪些页面可以用。

PPT-Deck-Pro-Max 负责告诉你：这套新方案应该怎么讲。

中间还需要一个编排者，负责把新叙事、历史页面、缺口页面、人工选择和最终交付串起来。

这个编排者，就是我接下来会继续做的项目：Deck Master。

它会尝试回答一个更接近真实工作流的问题：

当我要做一套新方案时，AI 能不能先理解任务，再检索历史 PPT 资产，然后判断哪些页复用、哪些页改写、哪些页新建，最后生成一套可以被审查和继续打磨的完整 Deck？

这个项目之后，我也会继续分享我自己做 PPT 的真实流程。

我会把一套商业方案从需求、资料、历史资产、叙事构建、页面选择、缺口生成到最终输出的过程，拆开给大家看。

如果你也关心 AI 如何真正进入方案生产、售前材料、咨询交付和商业表达，后面可以继续关注我。

我是臧青，一名 AI 商业架构师。
我帮助企业把模糊的 AI 机会，收敛成可验证、可落地、可复制的商业方案，让 AI 不停留在概念、工具和 demo 层，而真正进入增长、效率与组织资产。

// End of Stream

关注主页 @臧青内容智能，解锁更多 [AI 落地] 与 [企业智能化转型] 的深度思考。

🕹️ 首发于 GameStarted. Life

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业