我要投稿

不想给 Claude 付费，但想玩 Skills？我用国产模型搞定了

发布日期：2025-10-21 09:53:27 浏览次数： 2448

作者：AIGC新知

微信搜一搜，关注“AIGC新知”

我喜欢把 AI 当同事用，而不是当工具。

这篇文章记录我和 AI 一起工作的过程，不只是测评，而是实验。

以前的 AI 是万事通，但通而不精。

你骂它，它还会说：卧槽，用户怒了。情绪价值给到位了。

但是它就是不能好好干活，要么给你偷工减料，要么直接给你拉依托大的，把所有电子垃圾给你整出来，我那个项目文件夹下，一堆它给我创建的文件，什么js，md，真的服了。

有的时候，你还得像爹一样，训一下这个不听话的活宝，它才会乖乖听话照做。

换个角度，AI如果长了脑子，估计把电脑都能给砸了。

以及，我那个听不懂人话的AI搭子。

终于理解，AI为啥替代不了人类了。

我发现大多数人用AI，都还停留在命令它的阶段。

而我想试的是另一件事：让AI拥有角色和能力，再和我一起干活。

这次，我让 Claude Skills 和国产模型一起上岗，看 AI 能不能真正理解“协作”二字。

前两天，Anthropic 开源了一个叫「Claude Skills」的项目，这玩意可能真的把“AI能干啥”重新定义了。

不再“指挥”AI，而是给它加载技能。

Claude Skills：AI的脚手架

Claude Skills 本质上是一个AI 的能力封装框架。它让 Claude 不再只理解语言，而能调用「技能模块」去执行任务。

换句话说，这是一种“AI 的操作系统思维”：

人类提供任务与目标
AI 通过调用技能完成链式操作
不同技能像插件一样可组合、可共享

每个 Skill 都是一个可执行单元。这些技能可以是：

pptx-skill —— 让 AI 生成完整的演示文稿；
document-skill —— 解析文档结构；
webapp-testing —— 自动执行前端测试；

它的底层逻辑是让 AI 不再靠猜（Prompt），而是靠执行（Skill）。

Skills 让 AI 重新变得像人：有专业分工，有明确边界，有自己的长项。

以pptx-skills解读为例

在山佬 @洛小山的群里，群友们聊到 Claude 的这个技能项目。

以前 HTML 转 PPT 的生成方式总是丑到离谱，结构混乱、缺乏设计逻辑。

我先做了一个小实验，让 Claude Code 去分析 pptx-skill 这个技能。

我的问题很简单：

请解释 pptx-skill 的核心结构，它是如何将 HTML 转成 PPT 的？

Claude 没有给出演示模板，而是像个架构师一样，先带我读规范。

它从 OOXML 标准讲到 ECMA-376，再提到 WML、MCE 的历史演化。

那一刻，我意识到它不是在执行命令，而是在理解整个项目的逻辑。

从大的方面来说，一个好的PPT页面需要字体、图像、表格等设计的面面俱到。

整体上分为两大模块，首先是生成PPT的OOXML结构，完全兼容微软office设计规范。

《OOXML（Office Open XML）是由微软公司为Office 2007产品开发的技术规范，对应的ECMA标准编号为ECMA-376。

前身是ECMA 376，历经五代版本。

这一点可以从项目文件夹看到。

至于MCE，它是一款基于Windows XP Professional（非常古老），整合到家庭影院电脑的应用程序。

WML，则是WAP规范指定的基于XML的基本内容格式，使用支持该规范的设备（特指移动终端）可以浏览WML的页面。

比如这样的代码：

<?xml version="1.0"?> 
<!DOCTYPE wml PUBLIC "-//PHONE.COM//DTD WML 1.1//EN" "http://www.phone.com/dtd/wml11.dtd" > 
<wml>   
<card id="main" title="First Card">     
<p mode="wrap">This is a sample WML page.</p>   
</card> 
</wml>

你就可以在手机上也能看到显示的网页了。

图：技术规范

图：ISO/IEC 29500:2008

其次是HTML转成PPT的工作流，不同的是，支持多种比例和不同样式支持。

后面演示效果。

还有不同的工具脚本，在PPT制作方面很实用。

HTML 转 PPT 的协作流程

过去 HTML 转 PPT 的生成方式像是「翻译」，而 Skills 的出现让它变成了「编排」。

Claude 将流程拆分为三种不同的工作流：

基于 HTML 内容结构生成 OOXML 文件；
根据主题与比例动态调整版式；
调用特定样式与图表生成脚本。

每个环节都由独立的子任务完成，逻辑清晰、可并行执行。

这意味着：AI 不仅仅是只能生成结果，在理解项目、任务结构上页出色。

Document Skills提示词模板

Claude Skills 项目虽然开源，但部分功能与 Claude 账号深度绑定。

作为AI博主，我不满足于只能看，于是尝试用国产模型复刻这个机制。

我先克隆了官方的 Skills 仓库，然后把它的 Shell 脚本转换成自然语言 Prompt 模板，比如：

把这个shell脚本转成一句提示词模板，比如：

使用kimi-k2模型，通过内置 pptx Skill 自动生成一份主题为「可再生能源」的演示文稿，并支持代码执行环境以便动态生成图表或数据内容。

国产模型（Kimi-K2、GLM-4.5、DeepSeek）也能读懂这种结构化意图，自动调用相关模块执行任务。

然后他就会自主调用相关的资源去帮你干活了。

具体生成效果需要自己评估。。。

再比如：

使用 kimi-k2模型与 xlsx Skill，生成一份简单的预算表 Excel 文件，并返回下载链接。

直接生成了可预览的excel处理页面和下载链接。

以及更复杂的复合调用（都是钱，MD）：

调用document-skills的 xlsx（表格分析）和pptx（演示生成）两个skills， 以及需要自定义数据分析 Skill（使用skill-creator和template-skill两个skills自定义创建），分析销售数据并基于分析结果自动创建演示文稿，支持代码执行以进行数据计算与可视化。

创意设计类

Claude Skills 还提供了一系列创意设计类项目。

我尝试用它生成完整的视觉作品：

请使用以下项目文件夹下已经有的创意技能协作生成一件完整的视觉作品：

使用 algorithmic-art 技能，通过带种子随机性的流场与粒子系统创建生成艺术基础图案。

使用 canvas-design 技能，将作品以专业的视觉设计理念排版输出为 .png 与 .pdf 格式。

使用 slack-gif-creator 技能，基于生成的艺术元素制作一段适合 Slack 尺寸的循环动画 GIF。

整体风格需保持现代、抽象且具有品牌视觉一致性，可加入轻微的动态粒子效果以提升视觉吸引力。

AI 会自动完成素材、排版、动画三步协作。

第一次，我看到了AI 主动参与创意决策的过程——它在生成，也在理解。

企业级 Skills：从品牌到开发测试

Claude Skills 里还有很多偏向企业与技术团队的模块。

我试了几个典型场景：

请生成一份面向公司内部的季度汇报演示文稿，内容包含本季度主要成果与下季度重点计划。

使用 brand-guidelines 技能应用蒙牛官方品牌颜色与排版规范；
使用 theme-factory 技能为演示文稿设置简洁专业、符合品牌视觉的主题；
使用 internal-comms 技能撰写内容，语气清晰、亲和且符合企业内部传播风格。

这类协作非常像“虚拟创意团队”的分工。

同样，开发与测试类的 Skills 则构成了另一个层面的实验：

请使用以下项目文件夹已经存在的开发技能协作构建并测试一个完整的 Web 应用原型：

使用 artifacts-builder 技能，基于 React、Tailwind CSS 和 shadcn/ui 组件构建一个功能完善、可交互的 claude.ai HTML 工件；

使用 MCP-server 技能，生成高质量的 MCP 服务器端代码示例，并展示如何将外部 API 与该前端工件安全集成；

使用 webapp-testing 技能，利用 Playwright 对本地 Web 应用进行 UI 验证与调试，确保交互逻辑正确且界面稳定。

最终输出应包括可运行的前端代码片段、后端接口说明以及自动化测试脚本，整体风格保持代码整洁、模块化、可扩展。