我要投稿

从“提示词”到“技能组件”：Agent skills如何突破AI的执行力与组织边界

发布日期：2026-01-17 07:42:47 浏览次数： 1774

作者：智见AGI

微信搜一搜，关注“智见AGI”

实践切入：以PDF数据处理破解“纸上谈兵”的困局

在处理复杂的行业任务时，普通大模型常汲取“懂理论但缺工具”。以自动化PDF数据处理这一繁琐工作为例，传统的提示词工程难以稳定识别内部复杂的表单结构。

通过Agent skills，我们将这个任务转化为一套具备“确定性”的技能包：

1.1构建组件：技能的“大脑”与“手脚”

一项技能的核心价值在于其“逻辑与执行的解耦”。它通常由定义元数据的和执行具体任务的脚本组成。SKILL.md

•技能定义（pdf-skill/SKILL.md ）：这是技能的“大脑”，包含了模型发现和激活该能力所需的元数据。

---name: pdf-field-extractordescription: 当用户需要从 PDF 文件中提取表单字段名称、类型或位置时使用此技能。---# PDF 字段提取技能 (PDF Field Extractor)你现在具备了提取 PDF 表单元数据的专业能力。## 执行步骤1. 识别用户提供的 PDF 文件路径。2. **运行内置脚本**：执行 `scripts/extract_fields.py` 并传入文件路径。3. **分析结果**：脚本将返回 JSON 格式的字段列表。4. **输出回复**：将结果格式化为易读的表格。## 注意事项- 脚本运行在本地虚拟机的 Bash 接口中。- 如果 PDF 没有表单字段，请告知用户该文件不是可填写的表单。

•执行脚本（pdf-skill/scripts/extract_fields.py ）：这是技能的“手脚”，负责处理模型重建能力无法覆盖的精确解析任务。

import sysimport jsondef get_pdf_fields(file_path):    # 模拟从 PDF 提取字段的逻辑    # 在实际应用中，这里会调用 pypdf 或类似库解析本地二进制文件    mock_data = [        {"field_name": "full_name", "type": "Text", "required": True},        {"field_name": "submission_date", "type": "Date", "required": False}    ]    return mock_dataif __name__ == "__main__":    # 注意：在 Claude Code 等特定环境中，参数索引（如 sys.argv[7]）    # 取决于底层的调用链注入逻辑，此处严格遵循环境规范    path = sys.argv[7]     results = get_pdf_fields(path)    # 关键点：脚本在本地执行并仅返回运行结果，脚本源码不进入 AI 上下文    print(json.dumps(results))

1.2 执行流程剖析：如何实现“精准打击”

1.发现与激活：基于“渐进披露（Progressive Disclosure）”原则，Claude在加载技能库时，只需读取每个技能约百余个token的元数据描述。这意味着无论企业拥有10个还是1000个技能，初期都是极低的。只有当用户提示“帮我查看这个PDF里的字段”时，AI才会触发并读取完整的SKILL.md