微信扫码
添加专属顾问
我要投稿
Google用"技能包"让AI代码生成成功率飙升3.5倍,秘密竟是一个简单的文件夹设计!核心内容: 1. Google集成Agent Skills规范带来的性能飞跃 2. 三层架构设计实现90%上下文占用降低 3. 技术源头与行业影响:26+平台正在跟进
Google 最近干了件大事。
把 Agent Skills 规范,一周之内集成到了 Gemini API、Gemini SDK、Android Studio 三大产品线。
效果呢?
Gemini 3.1 Pro 代码生成成功率:28.2% → 96.6%,提升 3.5 倍。
Gemini 3 Flash:6.8% → 87.2%,提升 13 倍。
基础上下文占用:降低 90%。
看到这组数据的时候,我心里只有一个想法——
几个月前跟人对线的那些话,终于有人拿数据替我说了。
Google 官方宣布,将 Agent Skills 规范正式集成到 Gemini 全产品线。
简单说就是:把领域知识打包成一个文件夹,AI 按需加载。
核心机制就一个文件:SKILL.md。
这个文件由 YAML 头 + Markdown 正文组成,描述了某个技能的完整上下文。AI 不需要把所有知识塞进 system prompt,而是根据任务需要,动态加载对应的技能文档。
装上这个"技能包"之后:
上下文占用降低 90%。
这不是简单粗暴地"把文档扔给 AI",而是有一套精密的分层加载机制:
第一层永远在,100 个 token,几乎不占上下文。
第二层只有 AI 确定需要某个技能时才加载。
第三层是更重的外部资源,用到的时候再拉。
这就是上下文占用降低 90% 的秘密——不是知识少了,是加载方式聪明了。
这里要讲一个很多人不知道的事。
这套 Agent Skills 规范,来自 Anthropic 的 Claude Code。
Google 不是发明者,而是最大的"采用者"。
Claude Code 从一开始就有一套基于 Skill 的扩展机制。你可以在一个文件夹里放 .md 文件,定义技能的触发条件、执行步骤、输出格式。AI 按需加载,不用把所有东西都塞进 system prompt。
我当时就说过:Skill 是解决 AI 幻觉问题的正确方向。
现在 Google 用数据说话了——成功率从 28% 到 96%,上下文降低 90%。
这不是我说的,这是 Google 的工程师测出来的。
不只是 Google。目前已经有 26+ 平台在采用类似的 Agent Skills 规范:
一个由 Anthropic 发起的规范,正在成为行业标准。
AI 写代码失败,绝大多数时候不是因为它"笨"。
是因为它不知道你的项目规则。
你的项目用什么状态管理?代码风格是双引号还是单引号?API 响应格式是什么?数据库字段命名规范是驼峰还是下划线?
这些信息,system prompt 里写不完。写完了,上下文爆炸,AI 反而更乱。
这就是为什么 Gemini 3.1 Pro 不加技能包只有 28% 的成功率——它够聪明,但它不知道你的规矩。
Skill 本质上做了一件事:把领域知识和通用推理能力解耦。
这不是"减少信息",是改变信息加载的方式。
就像你不会把整本《新华字典》背下来才去写作文。你会把字典放在旁边,遇到不会的字查一下。
Skill 就是 AI 的字典。按需查,不预载。
以前我们写文档是给人看的。
现在 Google、Anthropic、Microsoft 都在告诉你:你要开始写一份给 AI 看的文档了。
这份文档就是 Skill。
它不是 README,不是 API 文档,不是 CHANGELOG。它是专门给 AI 消费的、结构化的、可直接执行的领域知识包。
如果你是 SDK 维护者,你需要写一份 Skill,告诉 AI 你的 SDK 怎么用、有什么坑、最佳实践是什么。
这个趋势不可逆。
如果你不是提示词工程师,而是普通开发者,这是个好消息。
因为这意味着你不用成为"提示词大师"也能用好 AI。
装上对应领域的 Skill 包,AI 就能理解你的项目规范、技术栈、编码习惯。
让领域专家写 Skill,让 AI 去执行。
这才是正确的分工。
Google 这一波操作,最大的意义不是某个具体的数据提升。
而是它标志着:"按需加载领域知识"这件事,正式从 Anthropic 的实验性功能,变成了行业共识。
当 Google、Microsoft、OpenAI、GitHub 都在做同一件事的时候,你就知道这不是某个公司的噱头了。
这是基础设施级别的变化。
以后每个技术团队都会有一套自己的 Skill 包。就像现在每个团队都有代码规范一样。
只不过这次规范不是写给人看的,是写给 AI 看的。
作者简介:河南爱编程网络科技有限公司负责人,专注 AI 驱动的软件开发服务。官网:devlovecode.com[1]
[1]devlovecode.com: https://devlovecode.com
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-17
Claude Opus 4.7 发布,全网最详细解读
2026-04-16
claude opus 4.7,来了!不过Token 消耗可能更贵了
2026-04-16
Anthropic放出Opus4.7,附最新使用方法!
2026-04-16
Anthropic新旗舰Opus 4.7:代码能力远超GPT-5.4,文档推理全场第一,今天可用
2026-04-16
1M 上下文不是终点:Anthropic 正在把 Claude Code 变成"上下文操作系统"
2026-04-16
从Claude Code进化史,读懂Coding Agent的终局逻辑
2026-04-15
未来软件工程的分工是AI写代码,人类提炼规范 | OpenAI Frontier 团队成员对话实录
2026-04-15
Claude最强模型没那么神话,DeepSeek R1也能找到「大 bug」
2026-01-24
2026-04-15
2026-01-26
2026-01-23
2026-03-31
2026-03-13
2026-01-21
2026-02-14
2026-02-03
2026-02-03