微信扫码
添加专属顾问
我要投稿
Agent Skills 带来更智能的知识检索方式,能否超越传统 RAG 的局限? 核心内容: 1. Agent Skills 的工作原理与渐进式加载策略解析 2. 对比传统 RAG 模式的痛点与 Skills 的创新优势 3. 实战演示跨格式知识检索 Skill 的实现与应用场景
使用 Agent Skills 做知识库检索,是一种什么体验?
它能比传统的分块+向量匹配的 RAG 效果更好吗?
大家好,欢迎来到 code秘密花园,我是花园老师,这一期我们进入 Agent Skills 的实战章节。
我们上期视频介绍了 Skills 的工作原理和使用方法,我们简单回顾一下:
Skills 是最近 Anthropic 推出的一个 Agent 领域的行业标准,它本身就是一个文件夹,里面存放着具体的使用说明(SKILL.md),更详细的参考文档(reference),以及可执行脚本(script)。
它的核心特性就是渐进式加载策略:
通过这样的模式,可以让 Agent 既能节省大量的上下文,又能够精准响应用户需求找到并执行某个技能。
Skills 的使用也非常简单,你只需要把它的文件夹放到特定 Agent 的目录下(如 .claude/skills),AI 就会在下次启动时识别到这个 Skill,并根据用户需求判断是否调用。
下面,我们来实战探索一下,Skill 有哪些有意思的玩法。
熟悉我的粉丝都知道,我本人对传统的通过 Chunk + Embedding 这种实现 RAG 的模式有比较大的偏见。
虽然这种模式最终也能调教出比较好的结果,但调优过程实在是太痛苦了,我是真正经历过毒打的才会有这种感觉。
相信很多同学也感同身受,所以我一直感觉这种方案只是当下的一种妥协模式,终究会被时代淘汰的。
最近 LlamaIndex 创始人 Jerry Liu 发表的 Twitter 刚好比较符合我的观点:
RAG / 检索本身没死,但死的是固定 Chunk + Embedding 那套模式。如果 Agent 可以动态地扩展文件周围的上下文,那么过度考虑数据块大小就没有意义了。
想象 Agent Skills 的渐进式批漏策略,是不是有点这个意思呢。
所以,我们考虑用 Skills 的设计模式,来实现一个专用于知识检索的 Skill,我期望它能帮我解决下面的问题:
下面,我们先来演示下效果,我们先创建一个示例知识库,其中包含下面这些数据:
知识库包含四个不同领域的知识,包含 markdown、pdf、excel 等多种文件类型:
我们先问一个金融领域具体的数据问题:
检索知识库:三一重工前三大股东?
这个数据存储在三一重工的 Q3 财报内:
检索结果如下,因为首次需要定位文件、转换 PDF 文件,耗时还是比较长的,但是检索到的信息非常准确, 大家在实际使用的时候可以把所有的 PDF 都提前转成 Markdown,效率会高很多。
接下来我们继续追问这个文件的问题(介绍三一重工的母公司资产负债表),速度就会快很多了:
接下来,我们问另外一个文件的问题:
航天动力前十股东总持股?
这时我们观察一下它的执行流程(整个过程是非常智能化的):
下面,我们尝试问另外一个电商领域的问题:
郑雪买了啥?
要回答这个问题需要分析两个 Excel 表:
看一下分析结果,依然准确找到了数据:
我们再追问一个更复杂的问题:有哪些用户买了 儿童绘本 ,在什么时间?
这次 Agent 更快的给出了结果,这个过程已经比较接近于我理想的 AI 智能知识检索的形态了,大家觉得怎么样呢。
下面,我们来看看这个 Skill 的实现原理,对于一个能执行 Skill 的 Agent(如 opencode),本身它已经具备了一些基础的文件检索能力(ls、grep、glob),我们只需要在这个 Skill 中教会 AI 如何更好的使用这些能力:
这里有两条关键设计原则:
另外想要让知识检索的更高效和精准,还有两个技巧:
那这个 Skill 怎么实现呢,其实你把上面我们提到的核心流程、设计原则、关键技巧给到我们上个教程中讲到的 skill-creator 这个 skill ,AI 自己就帮我们创建出来了,我们只需要经过细微的调整,下面我们来看下我们的 Skill 的目录结构:
我们可以把这套方案可以理解为「不预建向量库的、本地目录级、渐进式检索 RAG」,的优势主要在于:
当前这只是一个初步的尝试,它还有一定的缺陷:
刚刚我们介绍的 Skill 是一个通用的知识检索的尝试,但如果你有一个固定格式的知识库(比如一个文档站,里面已经包含了多个本地文件),你可以通过 Skill Creator 让它去自己分析你的文档站,然后创建出符合你的文档站风格的知识检索 Skill,我们可以在一个已有文档站下输入下面的提示词:
当前项目是一个文档站(包含多个 md、mdx 文件),我想创建一个专用于知识库检索的 Skill,它可以替代传统的 RAG ,用于当前文章站的知识检索,你来帮我创建这个 Skill(使用中文)。Skills 的基本思路是,先根据用户的问题,提取出需要检索的可能关键字,然后使用 Grep 命令找到对应的上下文。然后分析上下文,如果检索到的信息和问题不符合需要继续检索其他可能关键字,最大重试五次。
我们尝试在 Easy Dataset 文档站(https://github.com/ConardLi/easy-dataset-docs)创建一个Skill :
下面尝试问个问题:
检索知识库:如何使用 Easy Dataset 生成评估数据集?
由于这个文档站全是纯本文文档(没有 PDF 等特殊格式)检索速度非常快而起效果非常不错。
再问个问题:
检索知识库:Easy Dataset 有哪些分块策略?
通过这种模式,你可以把任意已经存在的本地知识库变成一个可以进行智能知识检索的 skill。
关注《code秘密花园》从此学习 AI 不迷路,相关链接:
如果本期对你有所帮助,希望得到一个免费的三连,感谢大家支持!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-03
告别向量数据库!PageIndex:让AI像人类专家一样阅读长文档
2026-02-02
OpenViking:面向 Agent 的上下文数据库
2026-02-02
别再迷信向量数据库了,RAG 的“大力出奇迹”该结束了
2026-01-29
告别黑盒开发!清华系团队开源 UltraRAG:用“搭积木”的方式构建复杂 RAG 流程
2026-01-28
RAG优化不抓瞎!Milvus检索可视化,帮你快速定位嵌入、切块、索引哪有问题
2026-01-28
今天,分享Clawdbot记忆系统最佳工程实践
2026-01-28
Fusion GraphRAG:超越 GraphRAG 的多模态企业级 AI 问答
2026-01-28
Semantic Kernel内存管理系统——为AI注入持久记忆与上下文感知能力
2025-12-04
2025-12-03
2025-11-13
2025-12-02
2025-11-13
2025-11-05
2026-01-15
2025-12-07
2025-11-06
2026-01-02
2026-02-03
2026-01-19
2026-01-12
2026-01-08
2026-01-02
2025-12-23
2025-12-21
2025-12-10