微信扫码
添加专属顾问
我要投稿
这篇文章教你如何用OpenHands+Skills+iOS快捷指令,打造真正落地的业务自动化系统,让TikTok爆款分析变得简单高效。核心内容:1. 为什么Claude Code在业务侧是伪需求2. 从刷视频到数据入库的完整闭环设计3. 基于OpenHands的云端Skills系统实现方案
最近 Claude Skills 很火。
但我观察了一圈,发现大家都在陷入一种“开发者的自嗨”。
绝大多数 Skills 的应用场景都被死死锁在 IDE 里,锁在开发者的电脑前。
这叫开发提效,不叫业务提效。
真正的业务发生在移动端,发生在你通勤、吃饭、甚至躺在床上刷 TikTok 的时候。
如果你的 AI 能力必须打开电脑、输入命令行才能调用,那它的时空效率就是零。
于是我抛弃本地的 Claude Code,基于 OpenHands 做了一套云端 Skills 系统。
效果极其简单粗暴:
我在刷 TikTok,看到一个爆款视频,点击复制链接,敲击 iPhone 背面三下。
20 秒后,我的飞书多维表格里自动新增了一行数据。
这行数据包含了:这个视频的无水印文件、Gemini 拆解的镜头语言分析、爆款原因推导,以及一套可直接复用的 AI 视频生成提示词。
全过程我不需要打开电脑,不需要切换 APP,不需要等待。
这就是我今天要聊的:如何用 OpenHands + Skills + iOS 快捷指令,构建一套真正落地的业务自动化系统。
先厘清两个概念:OpenHands 和 Claude Code。
Claude Code 是 Anthropic 官方推出的命令行工具,它是一个嵌入在你本地终端里的结对程序员。它的 Skills 本质是上下文记忆和本地工具接口。
它的优势是懂你的代码规范,能直接改你电脑里的文件。
但它有一个对于业务场景的致命弱点:它必须依附于你的会话,你不在,它就不动。
它是一个副驾驶(Copilot)。
而 OpenHands(前身 OpenDevin)是一个开源的、自主的 AI 软件工程师。它运行在 Docker 容器里,是一个独立的服务端 Agent。
https://openhands.dev/
它是一个可以被封装成 API 服务的数字员工。
我看重 OpenHands 的核心理由只有一个:它可以 24 小时在线,并且可以通过 API 远程唤醒。
我做的这个 TikTok 分析系统,本质就是把 OpenHands 部署在服务器上,通过 FastAPI 暴露接口。
Claude Code 是给你用的工具;OpenHands 是你雇佣的、随时待命的员工。
小提示:FastAPI 的服务地址后加/docs就是文档了
对于做出海营销和短视频矩阵的朋友,拆解爆款是每天的必修课。
传统的流程极其反人类:
这个链路太长,断点太多。任何需要延迟满足的流程,最终都会变成不了了之。
我的远程 Skills 方案,把这个流程压缩到了极致。
整个逻辑是这样的:
利用 iOS 自带的快捷指令 + 背部轻点功能。
OpenHands 接收到请求后,自主执行以下 Skills:
1. Playwright Skill:
启动无头浏览器。这里有一个技术难点,TikTok 的反爬虫机制非常严格。如果用普通的 request 请求,成功率几乎为零。OpenHands 调用 Playwright 模拟真实浏览器行为,绕过 blob 协议,抓取真实的 MP4 视频流。这种方式的下载成功率稳定在 70%-80%
2. Gemini Skill:
视频下载后,调用Gemini 2.5 Flash,快且便宜。它不只是看,它是理解。它可以识别拍摄角度(俯拍/特写)、运镜方式(推拉摇移)、BGM 节奏点、色彩心理学。
3. Feishu Skill:
将清洗好的结构化数据(JSON),通过 API 写入飞书多维表格。
结果:
当你刷完半小时视频,打开飞书,几十个爆款视频的深度分析报告已经整整齐齐躺在那里了。
这才是 AI 赋能业务的本质:隐形化。
Openhands 的 Skills 文档:
https://docs.openhands.dev/sdk/guides/skill
这套架构的核心逻辑是:移动端触发 -> 服务端 API -> OpenHands 执行复杂 Skills -> 结果回传。
这个逻辑在出海业务里有无限的延展性。
我给几个具体的场景,你们可以拿去直接落地。
场景一:竞品独立站监控
场景二:亚马逊差评自动预警与回复草稿
场景三:广告素材批量生产
这是很多技术出身的朋友最容易陷入的误区。
你这个功能,我写个 Python 脚本 + 定时任务也能跑,为什么要搞这么复杂的 OpenHands Skills?
因为业务逻辑是流动的,而脚本是僵死的。
如果你写死了一个 Python 脚本:
但在 OpenHands Skills 的架构下,我们定义的不是步骤,而是目标。
在我的 Skill 定义里,我告诉 OpenHands:你的任务是下载这个页面上的视频,如果常规方法失败,尝试模拟用户滚动;如果还失败,检查是否有验证码并尝试通过。
OpenHands 作为一个 Agent,它具备自主决策和自我修复的能力。
在跨境出海这种平台规则朝令夕改的环境下,维护脚本的成本极高。
我们需要的是一个能够理解意图并自主寻找路径的智能体。
文章到这里,这套远程 Skills 系统的雏形已经搭建完毕。
但如果你觉得这就结束了,那你就小看了 Agentic Skills 的天花板。
我们现在的架构是“一个请求触发一个 Skill”,但这只是冰山一角。真正的威力在于 Multi-Skill Orchestration(多技能编排)。
OpenHands 的 Skill 本质是可执行的逻辑单元。我们可以像写代码一样,让 Skill A 去调用 Skill B。
你可以构建一个自我迭代的 Agent。让它先写一段代码(Coding Skill),然后自己运行测试(Testing Skill),如果报错,递归调用 Coding Skill 进行修复,直到测试通过。
2. 混合云架构(Hybrid Agent Architecture)
OpenHands 运行在 Docker 里,这意味着它可以部署在任何地方。
这样,通过 API 网关,你可以指挥内网的 Agent 去调用外网的 Agent,实现数据在安全域和互联网域之间的智能流转。
3. “人机回环”的异步交互
谁说 API 只有“请求-响应”这一种模式? 在我的系统中,有些复杂任务(如竞品深度调研)可能需要运行 30 分钟。
你点击确认后,Agent 继续执行。这才是真正的人机协作:AI 处理海量冗余信息,人类只在关键节点做决策。
在这个体系下,Skills 不再是静态的脚本,而是可生长、可组合的原子能力。
未来,你的个人服务器里可能运行着上百个这样的 Skills。它们是一群田螺姑娘,在你睡觉的时候,帮你监控市场、回复邮件、整理知识、优化代码。
而你,只需要握着手机,轻轻敲两下背部,就像魔法师挥动了魔杖。
这,才是 Agent 时代的真正玩法。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-23
别再卖时间了!Trae + Skills:普通人把“经验”变现的第一次技术平权
2026-01-23
别把整个 GitHub 装进 Skills,Skills 的正确用法
2026-01-21
阅读笔记 | Future Skills 未来技能
2026-01-21
我下班后,Agent 继续替我上班。
2026-01-21
谁来给桌面 Agent 的转正签字?
2026-01-21
claude code更新了,利用Antigravity Tools用上了cc
2026-01-20
MyBrain:你的专属AI大脑,任务、笔记、日历日程、及书签收藏,实现“一站式”管理,掌控高效人生
2026-01-19
【干货分享】AI Coding 落地全流程
2026-01-08
2025-12-10
2025-10-28
2025-12-04
2025-12-25
2025-11-28
2025-12-14
2025-11-10
2025-11-17
2025-12-09
2026-01-21
2026-01-18
2025-12-25
2025-12-10
2025-12-09
2025-12-04
2025-11-20
2025-10-28