我要投稿

Google官宣：AI写代码成功率从28%飙到96%！秘密武器竟是一个文件夹

发布日期：2026-04-16 23:03:51 浏览次数： 1838

作者：全栈码农的 AI 局

微信搜一搜，关注“全栈码农的 AI 局”

前言

Google 最近干了件大事。

把 Agent Skills 规范，一周之内集成到了 Gemini API、Gemini SDK、Android Studio 三大产品线。

效果呢？

Gemini 3.1 Pro 代码生成成功率：28.2% → 96.6%，提升 3.5 倍。

Gemini 3 Flash：6.8% → 87.2%，提升 13 倍。

基础上下文占用：降低 90%。

看到这组数据的时候，我心里只有一个想法——

几个月前跟人对线的那些话，终于有人拿数据替我说了。

一、发生了什么？

1.1 Google 的"技能包"

Google 官方宣布，将 Agent Skills 规范正式集成到 Gemini 全产品线。

简单说就是：把领域知识打包成一个文件夹，AI 按需加载。

核心机制就一个文件：SKILL.md。

这个文件由 YAML 头 + Markdown 正文组成，描述了某个技能的完整上下文。AI 不需要把所有知识塞进 system prompt，而是根据任务需要，动态加载对应的技能文档。

装上这个"技能包"之后：

模型	装之前	装之后	提升倍数
Gemini 3.1 Pro	28.2%	96.6%	3.5 倍
Gemini 3 Flash	6.8%	87.2%	13 倍

上下文占用降低 90%。

1.2 三层架构：渐进式披露

这不是简单粗暴地"把文档扔给 AI"，而是有一套精密的分层加载机制：

层级	内容	Token 成本	触发条件
L1 元数据	技能索引，告诉 AI "我有什么技能"	~100 tokens	始终加载
L2 技能文档	完整的技能指令	<5000 tokens	AI 判断需要时加载
L3 外部资源	脚本、文档、代码示例	按需拉取	技能执行时按需获取

第一层永远在，100 个 token，几乎不占上下文。

第二层只有 AI 确定需要某个技能时才加载。

第三层是更重的外部资源，用到的时候再拉。

这就是上下文占用降低 90% 的秘密——不是知识少了，是加载方式聪明了。

二、这套东西从哪来的？

这里要讲一个很多人不知道的事。

这套 Agent Skills 规范，来自 Anthropic 的 Claude Code。

Google 不是发明者，而是最大的"采用者"。

Claude Code 从一开始就有一套基于 Skill 的扩展机制。你可以在一个文件夹里放 .md 文件，定义技能的触发条件、执行步骤、输出格式。AI 按需加载，不用把所有东西都塞进 system prompt。

我当时就说过：Skill 是解决 AI 幻觉问题的正确方向。

现在 Google 用数据说话了——成功率从 28% 到 96%，上下文降低 90%。

这不是我说的，这是 Google 的工程师测出来的。

2.1 26+ 平台在跟进

不只是 Google。目前已经有 26+ 平台在采用类似的 Agent Skills 规范：

Microsoft —— Copilot 生态
OpenAI —— ChatGPT 插件体系
GitHub Copilot —— 代码生成技能包
Cursor —— 编辑器级技能集成

一个由 Anthropic 发起的规范，正在成为行业标准。

三、为什么 Skill 能大幅提升成功率？

3.1 问题的本质

AI 写代码失败，绝大多数时候不是因为它"笨"。

是因为它不知道你的项目规则。

你的项目用什么状态管理？代码风格是双引号还是单引号？API 响应格式是什么？数据库字段命名规范是驼峰还是下划线？

这些信息，system prompt 里写不完。写完了，上下文爆炸，AI 反而更乱。

这就是为什么 Gemini 3.1 Pro 不加技能包只有 28% 的成功率——它够聪明，但它不知道你的规矩。

3.2 Skill 解决了什么？

Skill 本质上做了一件事：把领域知识和通用推理能力解耦。

没有 Skill：所有知识塞进 system prompt → 上下文爆炸 → AI 在海量信息中迷失 → 幻觉
有 Skill：system prompt 极简 → AI 先判断需要什么 → 按需加载对应技能 → 精准执行

这不是"减少信息"，是改变信息加载的方式。

就像你不会把整本《新华字典》背下来才去写作文。你会把字典放在旁边，遇到不会的字查一下。

Skill 就是 AI 的字典。按需查，不预载。

四、这对开发者意味着什么？

4.1 "写给 AI 看"成为新技能

以前我们写文档是给人看的。

现在 Google、Anthropic、Microsoft 都在告诉你：你要开始写一份给 AI 看的文档了。

这份文档就是 Skill。

它不是 README，不是 API 文档，不是 CHANGELOG。它是专门给 AI 消费的、结构化的、可直接执行的领域知识包。

如果你是 SDK 维护者，你需要写一份 Skill，告诉 AI 你的 SDK 怎么用、有什么坑、最佳实践是什么。

这个趋势不可逆。

4.2 对普通开发者的好消息

如果你不是提示词工程师，而是普通开发者，这是个好消息。

因为这意味着你不用成为"提示词大师"也能用好 AI。

装上对应领域的 Skill 包，AI 就能理解你的项目规范、技术栈、编码习惯。

让领域专家写 Skill，让 AI 去执行。

这才是正确的分工。

五、写在最后

Google 这一波操作，最大的意义不是某个具体的数据提升。

而是它标志着："按需加载领域知识"这件事，正式从 Anthropic 的实验性功能，变成了行业共识。

当 Google、Microsoft、OpenAI、GitHub 都在做同一件事的时候，你就知道这不是某个公司的噱头了。

这是基础设施级别的变化。

以后每个技术团队都会有一套自己的 Skill 包。就像现在每个团队都有代码规范一样。

只不过这次规范不是写给人看的，是写给 AI 看的。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-01

写代码快 10 倍，不等于研发快 10 倍！Google 揭秘 AI 系统级瓶颈

2026-06-01

Anthropic 发布《创始人指南》！教你如何创建一家独角兽企业

2026-06-01

现场即壁垒：OpenAI收购Tomoro背后的FDE战争

2026-05-31

Anthropic的六步闭环，让漏洞无处遁形

2026-05-29

软件架构演化简史：从单体到AI原生

2026-05-29

李开复王小川转身，大模型创业上半场结束

2026-05-29

如何把 Codex 用到极致

2026-05-29

全球Harness驾驭工程发展态势、模式演进与落地挑战分析

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

大家都在问

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw