2026年4月23日 周四晚上19:30,来了解“从个人单点提效,到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Google官宣:AI写代码成功率从28%飙到96%!秘密武器竟是一个文件夹

发布日期:2026-04-16 23:03:51 浏览次数: 1527
作者:全栈码农的 AI 局

微信搜一搜,关注“全栈码农的 AI 局”

推荐语

Google用"技能包"让AI代码生成成功率飙升3.5倍,秘密竟是一个简单的文件夹设计!

核心内容:
1. Google集成Agent Skills规范带来的性能飞跃
2. 三层架构设计实现90%上下文占用降低
3. 技术源头与行业影响:26+平台正在跟进

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


前言

Google 最近干了件大事。

把 Agent Skills 规范,一周之内集成到了 Gemini API、Gemini SDK、Android Studio 三大产品线。

效果呢?

Gemini 3.1 Pro 代码生成成功率:28.2% → 96.6%,提升 3.5 倍。

Gemini 3 Flash:6.8% → 87.2%,提升 13 倍。

基础上下文占用:降低 90%。

看到这组数据的时候,我心里只有一个想法——

几个月前跟人对线的那些话,终于有人拿数据替我说了。


一、发生了什么?

1.1 Google 的"技能包"

Google 官方宣布,将 Agent Skills 规范正式集成到 Gemini 全产品线。

简单说就是:把领域知识打包成一个文件夹,AI 按需加载。

核心机制就一个文件:SKILL.md

这个文件由 YAML 头 + Markdown 正文组成,描述了某个技能的完整上下文。AI 不需要把所有知识塞进 system prompt,而是根据任务需要,动态加载对应的技能文档。

装上这个"技能包"之后:

模型
装之前
装之后
提升倍数
Gemini 3.1 Pro
28.2%
96.6%
3.5 倍
Gemini 3 Flash
6.8%
87.2%
13 倍

上下文占用降低 90%。

1.2 三层架构:渐进式披露

这不是简单粗暴地"把文档扔给 AI",而是有一套精密的分层加载机制:

层级
内容
Token 成本
触发条件
L1 元数据
技能索引,告诉 AI "我有什么技能"
~100 tokens
始终加载
L2 技能文档
完整的技能指令
<5000 tokens
AI 判断需要时加载
L3 外部资源
脚本、文档、代码示例
按需拉取
技能执行时按需获取

第一层永远在,100 个 token,几乎不占上下文。

第二层只有 AI 确定需要某个技能时才加载。

第三层是更重的外部资源,用到的时候再拉。

这就是上下文占用降低 90% 的秘密——不是知识少了,是加载方式聪明了。


二、这套东西从哪来的?

这里要讲一个很多人不知道的事。

这套 Agent Skills 规范,来自 Anthropic 的 Claude Code。

Google 不是发明者,而是最大的"采用者"。

Claude Code 从一开始就有一套基于 Skill 的扩展机制。你可以在一个文件夹里放 .md 文件,定义技能的触发条件、执行步骤、输出格式。AI 按需加载,不用把所有东西都塞进 system prompt。

我当时就说过:Skill 是解决 AI 幻觉问题的正确方向。

现在 Google 用数据说话了——成功率从 28% 到 96%,上下文降低 90%。

这不是我说的,这是 Google 的工程师测出来的。

2.1 26+ 平台在跟进

不只是 Google。目前已经有 26+ 平台在采用类似的 Agent Skills 规范:

  • Microsoft —— Copilot 生态
  • OpenAI —— ChatGPT 插件体系
  • GitHub Copilot —— 代码生成技能包
  • Cursor —— 编辑器级技能集成

一个由 Anthropic 发起的规范,正在成为行业标准。


三、为什么 Skill 能大幅提升成功率?

3.1 问题的本质

AI 写代码失败,绝大多数时候不是因为它"笨"。

是因为它不知道你的项目规则

你的项目用什么状态管理?代码风格是双引号还是单引号?API 响应格式是什么?数据库字段命名规范是驼峰还是下划线?

这些信息,system prompt 里写不完。写完了,上下文爆炸,AI 反而更乱。

这就是为什么 Gemini 3.1 Pro 不加技能包只有 28% 的成功率——它够聪明,但它不知道你的规矩。

3.2 Skill 解决了什么?

Skill 本质上做了一件事:把领域知识和通用推理能力解耦。

  • 没有 Skill:所有知识塞进 system prompt → 上下文爆炸 → AI 在海量信息中迷失 → 幻觉
  • 有 Skill:system prompt 极简 → AI 先判断需要什么 → 按需加载对应技能 → 精准执行

这不是"减少信息",是改变信息加载的方式

就像你不会把整本《新华字典》背下来才去写作文。你会把字典放在旁边,遇到不会的字查一下。

Skill 就是 AI 的字典。按需查,不预载。


四、这对开发者意味着什么?

4.1 "写给 AI 看"成为新技能

以前我们写文档是给人看的。

现在 Google、Anthropic、Microsoft 都在告诉你:你要开始写一份给 AI 看的文档了。

这份文档就是 Skill。

它不是 README,不是 API 文档,不是 CHANGELOG。它是专门给 AI 消费的、结构化的、可直接执行的领域知识包。

如果你是 SDK 维护者,你需要写一份 Skill,告诉 AI 你的 SDK 怎么用、有什么坑、最佳实践是什么。

这个趋势不可逆。

4.2 对普通开发者的好消息

如果你不是提示词工程师,而是普通开发者,这是个好消息。

因为这意味着你不用成为"提示词大师"也能用好 AI。

装上对应领域的 Skill 包,AI 就能理解你的项目规范、技术栈、编码习惯。

让领域专家写 Skill,让 AI 去执行。

这才是正确的分工。


五、写在最后

Google 这一波操作,最大的意义不是某个具体的数据提升。

而是它标志着:"按需加载领域知识"这件事,正式从 Anthropic 的实验性功能,变成了行业共识。

当 Google、Microsoft、OpenAI、GitHub 都在做同一件事的时候,你就知道这不是某个公司的噱头了。

这是基础设施级别的变化。

以后每个技术团队都会有一套自己的 Skill 包。就像现在每个团队都有代码规范一样。

只不过这次规范不是写给人看的,是写给 AI 看的。


作者简介:河南爱编程网络科技有限公司负责人,专注 AI 驱动的软件开发服务。官网:devlovecode.com[1]

引用链接

[1]devlovecode.com: https://devlovecode.com

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询