2026年6月25日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

写代码你不在乎AI味儿,写文章为啥那么计较?

发布日期:2026-06-22 08:09:40 浏览次数: 1546
作者:Cinema169

微信搜一搜,关注“Cinema169”

推荐语

为什么AI写的代码没人说"一股AI味",而文章却一眼被识破?代码有五层"编译器"过滤,文章却只能靠读者直觉和检测产业来把关。

核心内容:
1. 代码可预测性强,AI生成内容更接近人类低熵区
2. 文本缺乏编译器,AI检测产业应运而生
3. AI生成与检测的"道高一尺魔高一丈"竞赛

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

你刷手机的时候有没有这种感觉:扫过三行就知道这玩意是AI写的,直接划走了,但你不会对AI写的代码这样要求。Ctrl+C,改几个变量名,推上去,code review的同事从来没说过"这段一股AI味"。你拿Cursor写、拿Claude Code写,AI生成的函数一眼扫过去,能用,就过了。

我在知乎上看到一个有意思的问题:"为什么AI写的代码没人说有AI味儿,但文章一眼就看出来了?"同一台机器,两个输出,一个让你放心,一个让你警惕,我这篇就讲讲自己的见解,以及我是如何治理AI味的。

(Ai生成图)



代码这个场景,其实很简单

2012年,UC Davis有个叫Hindle的人发了篇论文,《On the Naturalness of Software》。是说用自然语言模型预测代码,准确率比预测英语文本高得多。代码更可预测,这不是语法问题,人写代码的时候已经在压制"自我"了,你脑袋里同时在跑算法、数据结构、边界条件,没有人在写函数时表现性格,顾不上也不会让你乱搞。

所以当AI以"最高概率的词"排列输出时,在代码里它恰好落在人类代码本来住的低熵区。

还有一层:编译器。AI写出def sort(arr): return sort(arr),编译器直接报错,这行代码你见都见不到。语法检查、类型检查、lint、单元测试、运行时panic,五层筛子,AI生成的低质量代码在到达人类reviewer之前已经死了大半。

而在写文章里,AI闯进了人类写作那片高熵野地。每个作者有自己的口音、节奏、怪癖,AI的所谓最安全的路,一写完就很扎眼。AI写"熊猫是最可爱的动物,它最爱吃竹子,样子最憨态可掬",语法正确,语义垃圾,读者一看就烦。

所以代码圈没人计较AI味儿,不是谁更包容,是过滤了五道,到你面前早筛干净了,都是符合程序运行要求的内容。



文章没有编译器,但有个AI检测产业

写文章的这些文本可没编译器这玩意儿,写文章这种场景没有东西能在发布前告诉你"这段有AI味,别发",读者是唯一的权威判断。有检测需求就一定有检测产业。

Turnitin的AI检测覆盖了40%的美国四年制大学,直接集成到教学管理系统里,学生一提交论文自动扫描。GPTZero用户破了千万,公司年收入干到2400万美元。独立测试里ZeroGPT准确率只有73.8%,误报率却高达20.51%,每5篇人类写的文章就有1篇被错判为AI。有人拿美国独立宣言去测,某些工具判定为"99.99% AI生成"。就这样不严谨,AI检测照样是个挣钱的产业。

国内也一样。ContentAny瞄准头条号、百家号、公众号,20多项扫描堆上去:AI痕迹、流量预测、限流检测、人性化优化一把抓。头条自己也开始行动了,直接给你标上"疑似AI创作"。一条完整产业链就这么跑起来了:AI生成内容,平台检测降权,工具帮你绕过,平台升级检测,工具再升级,道高一尺魔高一丈的竞赛。

你注意一下这个产业的共同点:所有人都在管出口。检测、降权、绕过,全是文章写完之后的事。真正要问的问题不是"检测出AI味怎么办",是写的时候怎么不让它出来。

(Ai生成图)

两个场景的本质不一样

代码和文章被AI味困扰的原因不同,根子上是产品本质不一样。

写代码,产品是能跑的软件。代码本身是中间产物,你用某个框架、抄了一段Stack Overflow,没人问"这段是你自己写的吗"。AI只是工具链上新增的一环,软件跑得对,谁还在乎中间用了什么?

写文章,产品就是这段文字本身。读者在这里做的判断不是"这段信息有没有错",是这个人写的值不值得我花8分钟。论文更极端,论文的产品不是文字,是一个人的学术能力认证。文凭背后是一整套信任体系,AI替代了思考过程,认证即刻失效。简历也一样,招聘方不是质疑你的文笔,是质疑你是不是真的能干那些事。

代码圈的验证不需要"人"参与,编译器替你做了。文章的可信度没法让机器替你判断。只有人能回答"这个人说的话值不值得信"。



要先学会闻味儿

要让自己写的AI文章不被闻出来,头一件事是学会闻。

AI输出的句子长度像月饼模子,每句15到20字整整齐齐。人类写作是有呼吸的,长观察句、短判断句、破碎的感叹、突然一个30字左右的复句。

AI永远走最高概率那条路。"不仅……而且……""在XX时代""特别重要"。。这些词本身没问题。但它们以固定频率反复出现的时候就成了指纹,跟口音一样藏不住。

虚假范围也很常见,"从解决问题的工具到科学发现的艺术表达",X和Y没有任何关联,硬凑。过度拔高更常见:买双跑鞋写成"对自律生活方式的承诺",普通小城写成"韧性的象征"。

写到这儿我突然觉得不是在说别人,我自己的Agent在开始文章的时候,每三个段落就能扫出来一个"韧性的象征"级别的拔高。你别说,改多了会上瘾,看到一个拔高句就想动手。翻翻写的东西,是不是也有这种"不拔高就觉得不够深刻"的冲动?

再比如,结论完美但空洞:每段收尾像一个TED演讲的结语,但没有具体的人、具体的事。

这些不是玄学,元凶就是RLHF这种技术,人类反馈强化学习。AI被训练的时候,标注员给高分的是那些"标准答案"式回答。有犹豫、有矛盾、有不完美节奏的文本,因为"风险高"被淘汰了。结果AI学会了永远走"最安全的路"。



我是怎么治AI味的

说到怎么治,我对比过两条路。ContentAny这类工具走的是"出口堵"——写完检测,检测到就改,改完再过一遍检测。十几轮下来,文章面目全非,人也累够呛。我们自己跑的是另一条路:在入口就把AI味掐住。

这事说起来简单,做起来要一套系统。我搭了一个写作管线,不是把几个工具串起来凑数,是每一步卡一个容易出问题的口子。

整条AI写作管线是这样跑的:

(让AI做了一个Html页面,有点丑丑的)

第一步,选题调研。不是谁拍脑袋觉得有意思就写,得先查!这选题有没有人写过?能不能给读者提供信息增量?不要做旧闻重包装。这个环节我写了脚本强制验证:调研简报里不到两个独立来源、没关键数字、没说清楚"我们写有什么不一样",直接打回去让AI再查。选题如果不能一句话说清楚差异化,后面再怎么写都是白费。

第二步,大纲论证。千万不要AI列出个提纲就进行内容生成,你要自己看看,比如读者会在哪里困惑?逻辑跳不跳?大纲阶段得把这种大坑填了,初稿才不会写到一半发现方向错了。

第三步,初稿生成。这个阶段允许AI味儿存在,甚至故意不压它,因为你不知道AI会在哪里露出味道,得让它先自由发挥,后面有专门的环节治理。

第四步,审稿。这是管线里最重的一环,不是走过场。我设计了一套13个问题的检查清单,每条都是一个会翻车的点:开头能留住人吗?概念讲清楚了吗?论证逻辑跳了没?信息增量够吗?有没有只有这个作者才会这样写的观点?还有一个我自己最在意的指标,3000字里有没有那么两三个地方,让读者可能停下来想想",哦😮这我倒没想到啊"等等。如果没有,这篇文章还得改改。

第五步,去味儿。这里是我花力气最多的地方。我写了一个叫polisher(语言抛光器)的检查脚本,扫28种AI写作模式。不是人肉眼扫,是用规则引擎检查。从破折号滥用、句式过于齐整,再到虚假拔高、缺少细节等等,每种模式单独标记、逐个替换、回扫验证。这不是改几个词,是从节奏层面把文章从AI调调拉回人的调调。一般情况下,3000字的初稿跑一遍,polisher能扫出20多个问题。

为什么多用代码脚本而不是让AI大语言模型自己检查?因为我发现AI检查AI写的文章有个奇葩死结:你让它自我审查,它永远觉得没问题。你得再Skills里的代码脚本强制检查,比如碎片句检查多了就要合并,具体合哪几段,通过脚本直接告诉AI段落号。代码化后的规则比给prompt提示词可靠的多,我自己给AI定的Skills原则是如果用代码能实现那就他娘的代码,最大程度降低大语言模型的漂移性。

第六步,文字校对。错别字、标点、专有名词拼写。这一步叫proofreader,做的都是最笨的事,但翻车经常翻在这些笨事上,我之前就发现AI特别喜欢用“。”和“——”,不分地点的乱用。

第七步,最终审查。判断整体这篇文章像不像是我这个人在表达东西?读者会信吗?这个环节里做了算法设计,设定了评分门槛,如果低于83分那就继续改。

你可能注意到了,这套写作管线其实跟写代码的编译器逻辑很像,不是在出口检测,是在每一步卡一道关。选题关、大纲关、审稿关、去味关、文字关、终审关。AI味不是写完之后靠一个检测工具突然发现的,是在这六道关里一点一点被筛掉的。

还有一件事比这整条管线更重要:通过反馈让AI学会你的味道。给它塞3到5篇你自己写的文章,或者你觉得很不错的别人的文章,然后让它拆句式,爱用短句还是长句?高频词是什么?写完喜欢怎么收尾?然后明牌告诉它:这些照着来,被动语态别用、连续顿号别超过两个,这比写一万字提示词管用。一定学会让AI根据你的反馈自我进化,别总费劲写什么提示词,和AI相处有点像“禅宗”的“绕路说禅”,别直说,提示词就是属于直说,说多了Ai感觉会变傻😄。




我们该在意什么?

你不计较AI写的代码,因为代码是工具链上的一环,它要交的作业是"能跑"。编译器替你过了五道关,到你面前那段代码早筛干净了。你对AI写的文章警觉,因为文章要交的作业是"有人在对你说人话",没有机器能替你把关,你自己的本能在做判断:这里有没有活人。代码从1978年printf("hello world")到现在,从来不需要灵魂。但当你读一篇文章,你问看的不是"语法对不对",你看的是这句话后面有没有一个人的"灵魂"。

顺便提一嘴,这篇文章就是用我的写作Agent管线跑出来的,初稿时语言抛光(polisher)扫出22个问题、把8个碎片段合成了4个自然段,文字校(proofreader)揪出37处标点和引号问题。你正在读的是终审≥83分之后的版本。AI味儿?多少还是有的,但我在ContentAny网站上跑了AI检测,结果AI浓度为0%。好吧,绝逼是人类写的!


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询