我要投稿

写代码你不在乎AI味儿，写文章为啥那么计较？

发布日期：2026-06-22 08:09:40 浏览次数： 1546

作者：Cinema169

微信搜一搜，关注“Cinema169”

你刷手机的时候有没有这种感觉：扫过三行就知道这玩意是AI写的，直接划走了，但你不会对AI写的代码这样要求。Ctrl+C，改几个变量名，推上去，code review的同事从来没说过"这段一股AI味"。你拿Cursor写、拿Claude Code写，AI生成的函数一眼扫过去，能用，就过了。

我在知乎上看到一个有意思的问题："为什么AI写的代码没人说有AI味儿，但文章一眼就看出来了？"同一台机器，两个输出，一个让你放心，一个让你警惕，我这篇就讲讲自己的见解，以及我是如何治理AI味的。

（Ai生成图）

代码这个场景，其实很简单

2012年，UC Davis有个叫Hindle的人发了篇论文，《On the Naturalness of Software》。是说用自然语言模型预测代码，准确率比预测英语文本高得多。代码更可预测，这不是语法问题，人写代码的时候已经在压制"自我"了，你脑袋里同时在跑算法、数据结构、边界条件，没有人在写函数时表现性格，顾不上也不会让你乱搞。

所以当AI以"最高概率的词"排列输出时，在代码里它恰好落在人类代码本来住的低熵区。

还有一层：编译器。AI写出def sort(arr): return sort(arr)，编译器直接报错，这行代码你见都见不到。语法检查、类型检查、lint、单元测试、运行时panic，五层筛子，AI生成的低质量代码在到达人类reviewer之前已经死了大半。

而在写文章里，AI闯进了人类写作那片高熵野地。每个作者有自己的口音、节奏、怪癖，AI的所谓最安全的路，一写完就很扎眼。AI写"熊猫是最可爱的动物，它最爱吃竹子，样子最憨态可掬"，语法正确，语义垃圾，读者一看就烦。

所以代码圈没人计较AI味儿，不是谁更包容，是过滤了五道，到你面前早筛干净了，都是符合程序运行要求的内容。

文章没有编译器，但有个AI检测产业

写文章的这些文本可没编译器这玩意儿，写文章这种场景没有东西能在发布前告诉你"这段有AI味，别发"，读者是唯一的权威判断。有检测需求就一定有检测产业。

Turnitin的AI检测覆盖了40%的美国四年制大学，直接集成到教学管理系统里，学生一提交论文自动扫描。GPTZero用户破了千万，公司年收入干到2400万美元。独立测试里ZeroGPT准确率只有73.8%，误报率却高达20.51%，每5篇人类写的文章就有1篇被错判为AI。有人拿美国独立宣言去测，某些工具判定为"99.99% AI生成"。就这样不严谨，AI检测照样是个挣钱的产业。

国内也一样。ContentAny瞄准头条号、百家号、公众号，20多项扫描堆上去：AI痕迹、流量预测、限流检测、人性化优化一把抓。头条自己也开始行动了，直接给你标上"疑似AI创作"。一条完整产业链就这么跑起来了：AI生成内容，平台检测降权，工具帮你绕过，平台升级检测，工具再升级，道高一尺魔高一丈的竞赛。

你注意一下这个产业的共同点：所有人都在管出口。检测、降权、绕过，全是文章写完之后的事。真正要问的问题不是"检测出AI味怎么办"，是写的时候怎么不让它出来。

（Ai生成图）

两个场景的本质不一样

代码和文章被AI味困扰的原因不同，根子上是产品本质不一样。

写代码，产品是能跑的软件。代码本身是中间产物，你用某个框架、抄了一段Stack Overflow，没人问"这段是你自己写的吗"。AI只是工具链上新增的一环，软件跑得对，谁还在乎中间用了什么？

写文章，产品就是这段文字本身。读者在这里做的判断不是"这段信息有没有错"，是这个人写的值不值得我花8分钟。论文更极端，论文的产品不是文字，是一个人的学术能力认证。文凭背后是一整套信任体系，AI替代了思考过程，认证即刻失效。简历也一样，招聘方不是质疑你的文笔，是质疑你是不是真的能干那些事。

代码圈的验证不需要"人"参与，编译器替你做了。文章的可信度没法让机器替你判断。只有人能回答"这个人说的话值不值得信"。

要先学会闻味儿

要让自己写的AI文章不被闻出来，头一件事是学会闻。

AI输出的句子长度像月饼模子，每句15到20字整整齐齐。人类写作是有呼吸的，长观察句、短判断句、破碎的感叹、突然一个30字左右的复句。

AI永远走最高概率那条路。"不仅……而且……""在XX时代""特别重要"。。这些词本身没问题。但它们以固定频率反复出现的时候就成了指纹，跟口音一样藏不住。

虚假范围也很常见，"从解决问题的工具到科学发现的艺术表达"，X和Y没有任何关联，硬凑。过度拔高更常见：买双跑鞋写成"对自律生活方式的承诺"，普通小城写成"韧性的象征"。

写到这儿我突然觉得不是在说别人，我自己的Agent在开始文章的时候，每三个段落就能扫出来一个"韧性的象征"级别的拔高。你别说，改多了会上瘾，看到一个拔高句就想动手。翻翻写的东西，是不是也有这种"不拔高就觉得不够深刻"的冲动？

再比如，结论完美但空洞：每段收尾像一个TED演讲的结语，但没有具体的人、具体的事。

这些不是玄学，元凶就是RLHF这种技术，人类反馈强化学习。AI被训练的时候，标注员给高分的是那些"标准答案"式回答。有犹豫、有矛盾、有不完美节奏的文本，因为"风险高"被淘汰了。结果AI学会了永远走"最安全的路"。

我是怎么治AI味的

说到怎么治，我对比过两条路。ContentAny这类工具走的是"出口堵"——写完检测，检测到就改，改完再过一遍检测。十几轮下来，文章面目全非，人也累够呛。我们自己跑的是另一条路：在入口就把AI味掐住。

这事说起来简单，做起来要一套系统。我搭了一个写作管线，不是把几个工具串起来凑数，是每一步卡一个容易出问题的口子。

整条AI写作管线是这样跑的：

（让AI做了一个Html页面，有点丑丑的）

第一步，选题调研。不是谁拍脑袋觉得有意思就写，得先查！这选题有没有人写过？能不能给读者提供信息增量？不要做旧闻重包装。这个环节我写了脚本强制验证：调研简报里不到两个独立来源、没关键数字、没说清楚"我们写有什么不一样"，直接打回去让AI再查。选题如果不能一句话说清楚差异化，后面再怎么写都是白费。

第二步，大纲论证。千万不要AI列出个提纲就进行内容生成，你要自己看看，比如读者会在哪里困惑？逻辑跳不跳？大纲阶段得把这种大坑填了，初稿才不会写到一半发现方向错了。

第三步，初稿生成。这个阶段允许AI味儿存在，甚至故意不压它，因为你不知道AI会在哪里露出味道，得让它先自由发挥，后面有专门的环节治理。

第四步，审稿。这是管线里最重的一环，不是走过场。我设计了一套13个问题的检查清单，每条都是一个会翻车的点：开头能留住人吗？概念讲清楚了吗？论证逻辑跳了没？信息增量够吗？有没有只有这个作者才会这样写的观点？还有一个我自己最在意的指标，3000字里有没有那么两三个地方，让读者可能停下来想想"，哦😮这我倒没想到啊"等等。如果没有，这篇文章还得改改。

第五步，去味儿。这里是我花力气最多的地方。我写了一个叫polisher（语言抛光器）的检查脚本，扫28种AI写作模式。不是人肉眼扫，是用规则引擎检查。从破折号滥用、句式过于齐整，再到虚假拔高、缺少细节等等，每种模式单独标记、逐个替换、回扫验证。这不是改几个词，是从节奏层面把文章从AI调调拉回人的调调。一般情况下，3000字的初稿跑一遍，polisher能扫出20多个问题。

为什么多用代码脚本而不是让AI大语言模型自己检查？因为我发现AI检查AI写的文章有个奇葩死结：你让它自我审查，它永远觉得没问题。你得再Skills里的代码脚本强制检查，比如碎片句检查多了就要合并，具体合哪几段，通过脚本直接告诉AI段落号。代码化后的规则比给prompt提示词可靠的多，我自己给AI定的Skills原则是如果用代码能实现那就他娘的代码，最大程度降低大语言模型的漂移性。

第六步，文字校对。错别字、标点、专有名词拼写。这一步叫proofreader，做的都是最笨的事，但翻车经常翻在这些笨事上，我之前就发现AI特别喜欢用“。”和“——”，不分地点的乱用。

第七步，最终审查。判断整体这篇文章像不像是我这个人在表达东西？读者会信吗？这个环节里做了算法设计，设定了评分门槛，如果低于83分那就继续改。

你可能注意到了，这套写作管线其实跟写代码的编译器逻辑很像，不是在出口检测，是在每一步卡一道关。选题关、大纲关、审稿关、去味关、文字关、终审关。AI味不是写完之后靠一个检测工具突然发现的，是在这六道关里一点一点被筛掉的。

还有一件事比这整条管线更重要：通过反馈让AI学会你的味道。给它塞3到5篇你自己写的文章，或者你觉得很不错的别人的文章，然后让它拆句式，爱用短句还是长句？高频词是什么？写完喜欢怎么收尾？然后明牌告诉它：这些照着来，被动语态别用、连续顿号别超过两个，这比写一万字提示词管用。一定学会让AI根据你的反馈自我进化，别总费劲写什么提示词，和AI相处有点像“禅宗”的“绕路说禅”，别直说，提示词就是属于直说，说多了Ai感觉会变傻😄。

我们该在意什么？

你不计较AI写的代码，因为代码是工具链上的一环，它要交的作业是"能跑"。编译器替你过了五道关，到你面前那段代码早筛干净了。你对AI写的文章警觉，因为文章要交的作业是"有人在对你说人话"，没有机器能替你把关，你自己的本能在做判断：这里有没有活人。代码从1978年printf("hello world")到现在，从来不需要灵魂。但当你读一篇文章，你问看的不是"语法对不对"，你看的是这句话后面有没有一个人的"灵魂"。

顺便提一嘴，这篇文章就是用我的写作Agent管线跑出来的，初稿时语言抛光（polisher）扫出22个问题、把8个碎片段合成了4个自然段，文字校（proofreader）揪出37处标点和引号问题。你正在读的是终审≥83分之后的版本。AI味儿？多少还是有的，但我在ContentAny网站上跑了AI检测，结果AI浓度为0%。好吧，绝逼是人类写的！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业