免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

大神Karpathy的AI编程避坑指南与开源Skill(附安装教程)

发布日期:2026-05-13 14:41:02 浏览次数: 1562
作者:模智空间

微信搜一搜,关注“模智空间”

推荐语

AI编程大神Karpathy亲述工作流巨变,从80%手动到80%AI,效率革命与潜在风险一网打尽。

核心内容:
1. Karpathy亲历的AI编程效率革命与体验变化
2. AI编程的常见“坑”与未来挑战(如“Slopacolypse”)
3. 核心观点:LLM的价值在于按目标完成任务,而非仅写代码

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

当 AI 能完成 80% 的代码,程序员的工作到底会变成什么样?

如果你关注 AI 编程,大概率在年初被Andrej Karpathy(OpenAI创始成员、前特斯拉 AI 总监)的一篇帖子刷屏了。这位 AI 领域的顶级大神,用亲身经历描述了过去两个月里,自己编程工作流的巨大变化。近日,有人将他的核心观点提炼成一个可直接落地的skill,开源在 GitHub 上,短短时间就收获了 124000个星标。

地址:https://github.com/forrestchang/andrej-karpathy-skills

一、Karpathy 看到了什么?

作为深耕AI与编程领域20年的专家,Karpathy的体验极具参考价值,他表示,2025 年 11 月的时候,自己的编程习惯还是:80% 手动 + 20% AI 辅助

到了 12 月,这个比例彻底倒了过来:80% 交给 AI 智能体,自己只做 20% 的修改和润色

“我现在基本上是用英语在编程了。”

他坦言,这有点伤自尊,毕竟写了二十年代码,突然变成了“动嘴指挥”的角色。但理智告诉他,用大段的“代码动作”操作软件,实在太高效了,一旦你适应了配置、学会了使用、摸清了它的能力边界,就再也回不去了。

AI 编程不仅提升了现有任务的速度,更让工程师能做的事变多了。以前觉得不值得花时间编程的小工具、因知识盲区无法触碰的项目,现在借助AI都能轻松落地。更有意思的是,编程变得更有趣了,AI包揽了填坑、补语法等枯燥工作,工程师可以专注于创意和核心逻辑设计,减少了被卡壳的挫败感。

除此之外,LLM的坚韧也让他印象深刻:AI不会疲劳、不会气馁,能为一个问题持续尝试30分钟直至解决,而这正是人类工程师的耐力短板。这种永不放弃的特性,让很多复杂问题的解决效率大幅提升,也让他感受到了AGI(通用人工智能)的雏形。

AI 编程的“坑”

Karpathy 也泼了一盆冷水:别被“无需 IDE”“智能体集群”之类的 hype 冲昏头脑。

“模型还是会犯错,而且错误类型变了。”

以前 AI 的错误是语法错误、拼写错误,现在变成了概念性错误。以下是最常见的几类AI 毛病:

尽管如此,Karpathy 依然强调:这些问题是“成长中的烦恼”,整体上效率仍然是巨大的提升。

除此之外,Karpathy还提到两个值得深思的点:

  • 一是长期用AI编程,可能会导致手动编程能力退化;
  • 二是他预判2026年将迎来“Slopacolypse”(垃圾信息泛滥),GitHub、论文平台等会被大量AI生成的低质量代码、内容充斥,同时还会伴随更多“AI productivity theater”(表面用AI提升效率,实则没产生实际价值的形式主义)。

Karpathy最核心的观点是:LLM的最大价值,不在于让它替你写代码,而在于让它按你的目标完成任务。

“不要告诉AI做什么,给它明确的成功标准,它会自己找到方法”。

二、Karpathy Skill:把大神经验变成一套可执行规则

正当大家都在琢磨怎么落地这些观察时,开发者 Forrest Chang 把 Karpathy 的观点提炼成了一个 CLAUDE.md 文件,本质上是一套给 Claude Code 的行为准则。这套准则的核心,是四个原则,直接对应 Karpathy 指出的那些痛点。

GitHub 地址:

👉 https://github.com/forrestchang/andrej-karpathy-skills

原则1:先思考,再编程

核心目标:解决LLM爱做假设、不澄清、不权衡的问题,让AI的每一步都有明确依据。

具体做法很简单:

  • 明确列出所有假设,不确定的地方先提问,不瞎猜;
  • 遇到模糊需求时,给出多种解读方案,不擅自选一种执行;
  • 如果有更简单的方法,主动“反驳”你的指令,不盲目顺从;
  • 一旦遇到不懂的地方,立刻停止并说明,不硬着头皮继续。

本质是强制AI透明化思考。

原则2:简洁优先

核心目标:对抗LLM堆砌代码的习惯,用最少的代码解决问题,避免冗余和过度设计。

核心要求就是不做多余的事,具体可以参考这几条:

  • 只实现需求明确要求的功能,不做用户没要求的功能;
  • 不为只用一次的代码写抽象层;
  • 不做无用的灵活性,比如需求没要求可配置,就不用写复杂的配置项;
  • 不可能出现的场景,不用做错误处理;
  • 自我检验:如果一个资深工程师看了你的代码,觉得太复杂了,就立刻简化。

这正是针对Karpathy提到的“1000行代码简化到100行”的场景,AI会默认追求全面,而这个原则会强制它聚焦核心,写出简洁、高效、易维护的代码。

原则3:精准修改

核心目标:解决LLM乱改无关代码、注释的问题,让每一处修改都有明确的目的,不画蛇添足。

简单说就是只改该改的,不添不该添的,具体规则如下:

  • 编辑现有代码时,不优化相邻的代码、修改注释或调整格式,哪怕觉得格式不好看;
  • 没坏的代码不重构,不做为了重构而重构的无用功;
  • 尽量匹配现有代码风格,哪怕你个人不喜欢这种风格;
  • 发现无关的无用代码,只提醒不删除;只有自己的修改导致的无用代码(比如多余的导入),才删除。

检验标准很简单:每一行修改,都能对应到用户的具体需求,如果说不出为什么改这一行,那这行修改就是多余的。

原则4:目标驱动执行

这是最核心的原则,完全贴合Karpathy的启示:不告诉AI怎么做,只告诉它做到什么程度,让AI发挥持续尝试的优势,自主完成任务。

关键是把模糊指令变成可验证的目标,比如:

如果是多步骤任务,还可以让AI先列出计划,每一步都明确验证标准,比如:

1. [步骤一] → 验证方式:[具体检查点]

2. [步骤二] → 验证方式:[具体检查点]

3. [步骤三] → 验证方式:[具体检查点]

这样一来,AI就能自主循环尝试,不用你反复提醒。

三、这四条原则到底怎么装进你的工作流?

这个skill的优势在于简单易上手,不需要复杂的配置,有两种方式可以直接使用,适合不同场景:

方式1:Claude Code插件(推荐)

如果经常用Claude Code编程,直接安装插件,所有项目都能使用这些原则:

# 在 Claude Code 中添加 marketplace/plugin marketplace add forrestchang/andrej-karpathy-skills# 安装插件/plugin install andrej-karpathy-skills@karpathy-skills
方式2:CLAUDE.md文件(按项目生效)

如果只需要在特定项目中使用,直接生成CLAUDE.md文件即可:

  • 新项目:
curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md
  • 现有项目
echo "" >> CLAUDE.mdcurl https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md >> CLAUDE.md

另外,项目还支持Cursor编辑器,自带配置文件,打开项目后自动生效,无需额外操作。

小提醒:灵活权衡,不僵化执行

需要注意的是,这些原则更适合“非 trivial 任务”(比如核心功能开发、复杂bug修复)。如果是简单的打字错误、一行代码的修改,不用严格遵循所有原则。毕竟,原则的目标是减少高成本错误,而不是让简单任务的速度变慢。

如何判断准则生效?

使用一段时间后,只要出现这4个情况,就说明指南起作用了:

  • 代码修改记录(diffs)中,没有多余的无关修改,只有你要求的内容;
  • 不用反复让AI简化代码,第一次生成的代码就足够简洁;
  • AI会在编程前先提问澄清模糊点,而不是事后发现错误;
  • 提交的代码PR(合并请求)更简洁,没有“顺手优化”的无关内容。
四、Karpathy 的几个洞察
1. 关于“耐力”

“看一个 AI 智能体不知疲倦地工作,真的很有意思。它们从不累,从不气馁,只是不断尝试。”

Karpathy 点出一个本质:人类的耐力是工作的核心瓶颈之一,而 LLM 把这个瓶颈大幅提高了。

2. 关于“加速 vs 扩张”

AI 到底把编程速度提高了多少倍?Karpathy 说,这很难量化。因为真正的变化是:以前不值得手写的代码,现在愿意写了;以前因为知识或技能不够不敢碰的代码,现在敢了。

与其说是“加速”,不如说是“能力边界的大幅扩张”。

3. 关于“乐趣”

“我没想到,有了 AI 智能体,编程反而更有趣了。因为那些填坑式的苦差事被去掉了,剩下的是创造性的部分。”

但他也观察到,这会分化两类工程师:

  • 喜欢“写代码”本身的人(可能会失落)
  • 喜欢“构建东西”的人(会更兴奋)
4. 关于“技能退化”

“我已经注意到,我手写代码的能力在慢慢退化。但阅读和理解代码的能力还在,这两件事在大脑里是分开的。”

一个安慰:你可能会忘了某个循环的语法,但依然能看懂这段代码在干什么。

5.关于“2026:垃圾信息泛滥之年”

“我预测 2026 年会成为 Slopacolypse(垃圾内容末日) 之年,GitHub、Substack、arXiv、社交媒体……到处都会被 AI 生成的低质内容淹没。”

但他也冷静地补充:真正实质性的进步,会在喧嚣之外悄悄发生。

五、几个开放式问题
  • “AI编程效率远超平均水平的工程师”会怎样?普通工程师和顶级工程师之间的效率差距,可能会进一步拉大。
  • 通才 vs 专才?有了 LLM,是通才更占优还是专才?Karpathy 目前倾向通才,因为 LLM 更擅长填空(微观)而非大战略(宏观)。
  • 未来的 AI 编程像什么?像玩《星际争霸》?像玩《异星工厂》?还是像弹奏音乐?
  • 社会有多少瓶颈卡在数字知识工作上? 如果 AI 把这块打通,会释放多少生产力?

Karpathy 表示,2025 年 12 月是一个分水岭,LLM 智能体的能力(尤其是 Claude 和 Codex)跨过了一个连贯性阈值,引发了软件工程领域的相变。

2026 年将是行业消化这些新能力的高能量年份。

对于普通开发者来说,这套 Karpathy Skill 不只是一种工具配置,更是一种思维转变:

从“怎么写这段代码”变成“怎么清晰地描述我想要的目标”,然后让 AI 去执行、去试错、去迭代。

你不需要变成一个 AI 专家,你只需要学会给 AI 当导演,而不是当演员

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询