我要投稿

AI 时代，我找到了所有事情从 60 分到 100 分的密码

发布日期：2026-03-29 12:33:44 浏览次数： 1914

作者：粉象闪闪哥

微信搜一搜，关注“粉象闪闪哥”

你有没有这样的体验？

做一件事，努力了半天，感觉已经做得不错了——但就是停在那个"还行"的位置，再也上不去。

写文案，改了七八遍，感觉比最初好了很多，但读起来总差点意思。

做产品页面，自己看着挺满意，但转化率就是提不上来。

学一项技能，入门之后就进入了平台期，不知道下一步该往哪走。

我把这个状态叫做"60 分陷阱"——你付出了大量努力，却只能停在及格线附近。

最近我找到了一把可能突破这个陷阱的钥匙。它叫 Karpathy Loop。

一、那个让 AI 越来越强的秘密

Andrej Karpathy，前 Tesla AI 负责人，OpenAI 联合创始人。他提出了一个看似简单、却无比深刻的迭代框架：

假设 → 实施 → 打分 → 保留或回滚 → 下一轮

具体来说：

1. 先提出一个改进假设，然后去实施
2. 对实际结果打分，量化好坏
3. 如果比之前更好，就保留；如果更差，就回滚
4. 进入下一轮循环

听起来很平常？这不就是我们平时试错的过程吗？

对。但有一个关键区别：这个循环，可以由 AI 自动运行。

人工迭代，一天能跑几轮？

	人工改稿	AI 自动迭代
速度	一天 5 轮	一小时 50 轮
是否会妥协	"改了这么多遍了，就这样吧"	只认分数，不知疲倦
方向是否可追溯	凭感觉，难复盘	每轮记录，失败自动回滚

速度是人工的 10 倍以上，而且它不会累，不会妥协，不会因为"差不多了"就停下来。

这就是它的核心魔力：把人类最难坚持的事情——持续迭代、永不放弃——变成了机器的本能。

人工改稿拼的是耐力，AI 迭代拼的是标准。有了标准，耐力不再是瓶颈。

二、光说不练假把式

理解一个概念最好的方式，是亲手用它解决一个真实问题。

我选的例子是：亚马逊 Listing 优化。具体说，是产品标题（Title）和五点描述（Bullets）。

这是个典型的"60 分陷阱"场景：

• 随便写，可能只有 30 分
• 认真优化一遍，也许到了 60 分
• 但从 60 分到 90 分，靠人工一遍遍改，极其耗时，而且你根本不知道自己改的方向对不对

那，怎么做？

三、第一步：建标准——没有标准，优化是瞎忙

想优化，先得有标准。没有标准的优化，叫瞎改。

亚马逊 Listing 优化涉及大量行业知识：Amazon 官方合规规则、SEO 关键词策略、移动端展示逻辑、买家心理、竞品分析……这些知识分散在无数文章、指南、研究报告里。

我用的工具是 Notebook LM。

把所有权威资料——Amazon 官方文档、顶级卖家指南、SEO 研究报告——全部导入 Notebook LM，构建成这个领域的专属知识库。

知识库建好之后，我用 Claude Code 生成了一系列专业问题，然后让它去连接 Notebook LM 逐一提问。问题涵盖：

• 亚马逊标题有哪些硬性合规规则？
• 移动端截断后，前 80 个字符应该包含什么信息？
• 五点描述如何通过"那又怎样？"测试，把功能转化为利益？
• 关键词应该如何在标题和五点之间分配，避免重复浪费？

通过这些问题的答案，我从知识库里蒸馏出了一套量化评分标准——不再是"感觉还不错"，而是每个维度 0-20 分，总分 100 分，每个分数点都有明确依据。

这一步是整个方法论的基础。没有量化标准，Karpathy Loop 就无法运行。 你没办法迭代一个你无法衡量的东西。

四、第二步：封装 Auto Research Skill

有了评分标准，下一步是把它封装成一个可以自动运行的工具。

我在 Claude Code 里构建了一个 Auto Research Skill，它的运行逻辑很简单：

输入原始五点描述
        ↓
    Haiku 打分（快速、便宜）
        ↓
    找出最弱的维度
        ↓
    Sonnet 针对性改进（质量优先）
        ↓
    重新打分
        ↓
  比原来好？→ ✅ 保留
  比原来差？→ ↩️ 回滚，记录失败思路
        ↓
    进入下一轮