微信扫码
添加专属顾问
我要投稿
不想花冤枉钱玩Claude Skills?国产模型也能实现AI协作新玩法! 核心内容: 1. 对比传统AI与Claude Skills的协作模式差异 2. 国产模型实现类似Skills功能的具体实践方案 3. AI协作中角色定位与能力封装的关键突破点
我喜欢把 AI 当同事用,而不是当工具。
这篇文章记录我和 AI 一起工作的过程,不只是测评,而是实验。
以前的 AI 是万事通,但通而不精。
你骂它,它还会说:卧槽,用户怒了。情绪价值给到位了。
但是它就是不能好好干活,要么给你偷工减料,要么直接给你拉依托大的,把所有电子垃圾给你整出来,我那个项目文件夹下,一堆它给我创建的文件,什么js,md,真的服了。
有的时候,你还得像爹一样,训一下这个不听话的活宝,它才会乖乖听话照做。
换个角度,AI如果长了脑子,估计把电脑都能给砸了。
以及,我那个听不懂人话的AI搭子。
终于理解,AI为啥替代不了人类了。
我发现大多数人用AI,都还停留在命令它的阶段。
而我想试的是另一件事:让AI拥有角色和能力,再和我一起干活。
这次,我让 Claude Skills 和国产模型一起上岗,看 AI 能不能真正理解“协作”二字。
前两天,Anthropic 开源了一个叫「Claude Skills」的项目,这玩意可能真的把“AI能干啥”重新定义了。
不再“指挥”AI,而是给它加载技能。
Claude Skills 本质上是一个AI 的能力封装框架。它让 Claude 不再只理解语言,而能调用「技能模块」去执行任务。
换句话说,这是一种“AI 的操作系统思维”:
每个 Skill 都是一个可执行单元。这些技能可以是:
它的底层逻辑是让 AI 不再靠猜(Prompt),而是靠执行(Skill)。
Skills 让 AI 重新变得像人:有专业分工,有明确边界,有自己的长项。
在山佬 @洛小山 的群里,群友们聊到 Claude 的这个技能项目。
以前 HTML 转 PPT 的生成方式总是丑到离谱,结构混乱、缺乏设计逻辑。
我先做了一个小实验,让 Claude Code 去分析 pptx-skill 这个技能。
我的问题很简单:
请解释 pptx-skill 的核心结构,它是如何将 HTML 转成 PPT 的?
Claude 没有给出演示模板,而是像个架构师一样,先带我读规范。
它从 OOXML 标准讲到 ECMA-376,再提到 WML、MCE 的历史演化。
那一刻,我意识到它不是在执行命令,而是在理解整个项目的逻辑。
从大的方面来说,一个好的PPT页面需要字体、图像、表格等设计的面面俱到。
整体上分为两大模块,首先是生成PPT的OOXML结构,完全兼容微软office设计规范。
《OOXML(Office Open XML)是由微软公司为Office 2007产品开发的技术规范,对应的ECMA标准编号为ECMA-376。
前身是ECMA 376,历经五代版本。
这一点可以从项目文件夹看到。
至于MCE,它是一款基于Windows XP Professional(非常古老),整合到家庭影院电脑的应用程序。
WML,则是WAP规范指定的基于XML的基本内容格式,使用支持该规范的设备(特指移动终端)可以浏览WML的页面。
比如这样的代码:
<?xml version="1.0"?>
<!DOCTYPE wml PUBLIC "-//PHONE.COM//DTD WML 1.1//EN" "http://www.phone.com/dtd/wml11.dtd" >
<wml>
<card id="main" title="First Card">
<p mode="wrap">This is a sample WML page.</p>
</card>
</wml>
你就可以在手机上也能看到显示的网页了。
图:技术规范
图:ISO/IEC 29500:2008
其次是HTML转成PPT的工作流,不同的是,支持多种比例和不同样式支持。
后面演示效果。
还有不同的工具脚本,在PPT制作方面很实用。
过去 HTML 转 PPT 的生成方式像是「翻译」,而 Skills 的出现让它变成了「编排」。
Claude 将流程拆分为三种不同的工作流:
每个环节都由独立的子任务完成,逻辑清晰、可并行执行。
这意味着:AI 不仅仅是只能生成结果,在理解项目、任务结构上页出色。
Claude Skills 项目虽然开源,但部分功能与 Claude 账号深度绑定。
作为AI博主,我不满足于只能看,于是尝试用国产模型复刻这个机制。
我先克隆了官方的 Skills 仓库,然后把它的 Shell 脚本转换成自然语言 Prompt 模板,比如:
把这个shell脚本转成一句提示词模板,比如:
使用kimi-k2模型,通过内置 pptx Skill 自动生成一份主题为「可再生能源」的演示文稿,并支持代码执行环境以便动态生成图表或数据内容。
国产模型(Kimi-K2、GLM-4.5、DeepSeek)也能读懂这种结构化意图,自动调用相关模块执行任务。
然后他就会自主调用相关的资源去帮你干活了。
具体生成效果需要自己评估。。。
再比如:
使用 kimi-k2模型与 xlsx Skill,生成一份简单的预算表 Excel 文件,并返回下载链接。
直接生成了可预览的excel处理页面和下载链接。
以及更复杂的复合调用(都是钱,MD):
调用document-skills的 xlsx(表格分析)和pptx(演示生成)两个skills, 以及需要自定义数据分析 Skill(使用skill-creator和template-skill两个skills自定义创建),分析销售数据并基于分析结果自动创建演示文稿,支持代码执行以进行数据计算与可视化。
Claude Skills 还提供了一系列创意设计类项目。
我尝试用它生成完整的视觉作品:
请使用以下项目文件夹下已经有的创意技能协作生成一件完整的视觉作品:
使用 algorithmic-art 技能,通过带种子随机性的流场与粒子系统创建生成艺术基础图案。
使用 canvas-design 技能,将作品以专业的视觉设计理念排版输出为 .png 与 .pdf 格式。
使用 slack-gif-creator 技能,基于生成的艺术元素制作一段适合 Slack 尺寸的循环动画 GIF。
整体风格需保持现代、抽象且具有品牌视觉一致性,可加入轻微的动态粒子效果以提升视觉吸引力。
AI 会自动完成素材、排版、动画三步协作。
第一次,我看到了AI 主动参与创意决策的过程——它在生成,也在理解。
Claude Skills 里还有很多偏向企业与技术团队的模块。
我试了几个典型场景:
请生成一份面向公司内部的季度汇报演示文稿,内容包含本季度主要成果与下季度重点计划。
使用 brand-guidelines 技能应用蒙牛官方品牌颜色与排版规范;
使用 theme-factory 技能为演示文稿设置简洁专业、符合品牌视觉的主题;
使用 internal-comms 技能撰写内容,语气清晰、亲和且符合企业内部传播风格。
这类协作非常像“虚拟创意团队”的分工。
同样,开发与测试类的 Skills 则构成了另一个层面的实验:
请使用以下项目文件夹已经存在的开发技能协作构建并测试一个完整的 Web 应用原型:
使用 artifacts-builder 技能,基于 React、Tailwind CSS 和 shadcn/ui 组件构建一个功能完善、可交互的 claude.ai HTML 工件;
使用 MCP-server 技能,生成高质量的 MCP 服务器端代码示例,并展示如何将外部 API 与该前端工件安全集成;
使用 webapp-testing 技能,利用 Playwright 对本地 Web 应用进行 UI 验证与调试,确保交互逻辑正确且界面稳定。
最终输出应包括可运行的前端代码片段、后端接口说明以及自动化测试脚本,整体风格保持代码整洁、模块化、可扩展。
AI 不只是输出代码,而是自己组织协作链:
从设计 → 构建 → 测试 → 报告,全流程自动完成。
这让我第一次感觉到,AI 团队不再是比喻,而是真实可行的。
因为这个开源项目还在早期阶段,它依赖的是像 Claude 4 这样的全球顶尖编码模型。短期内,国产模型和这些国际一线的差距依然存在。
但开源的美妙就在于此——它是一块不断发酵的土壤。技术的力量会在这里生根发芽,最终开花结果,走向更普惠的未来,让科技真正为人所用。
回头看,两三年前的 AI 革命似乎才刚刚过去。那时我们以为差距天大,其实并没有多远。真正的分水岭,不在技术,而在人心。
愿意主动拥抱 AI 的人,依旧只是少数。绝大多数人并不关心算法、模型或参数,他们更在意明天菜市场的蔬菜是否便宜,今晚饭桌上吃什么,周末能否带孩子去郊外转转。
而这,恰恰是 AI 的意义所在——它终将渗透进这些日常的细节,成为生活的一部分,而不是高悬云端的奇技淫巧。
AI 的故事才刚刚开始。喧嚣之后的沉淀,才是真正的功夫。
致敬每一位在路上的先行者。
AI 从来不该是负担,它本该是我们创造的加速器。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-20
重磅:阿里的 Qoder CLI 正式发布
2025-10-20
想做独立产品的人,趁早放弃Coze拥抱编程
2025-10-20
DeepSeek开源的不仅仅是个新OCR模型。。。
2025-10-20
DeepSeek又开源,这次是OCR模型!附论文解读!
2025-10-18
免费的OpenAI Operator平替?这款AI浏览器插件火了!
2025-10-18
对话Plaud许高:模仿者如果真相信「Plaud」,该停掉所有业务,只干这个
2025-10-18
Anthropic Skills 深度解析:当通用 Agent 学会专业技能
2025-10-17
阿里开源通义DeepResearch:智能体训练全流程揭秘
2025-08-20
2025-09-07
2025-08-05
2025-08-20
2025-07-29
2025-07-31
2025-07-29
2025-08-26
2025-07-27
2025-08-22
2025-10-13
2025-09-29
2025-09-17
2025-09-09
2025-09-08
2025-09-07
2025-09-01
2025-08-16