微信扫码
添加专属顾问
我要投稿
深入剖析ChatGPT降智现象及其影响,为用户和开发者提供实用指南。核心内容:1. ChatGPT降智现象的实测对比与发展历程2. 关键影响因素分析及IP健康度与降智无关的实证3. 降智测试方法与最佳实践建议
「有人说,
大模型的魔力就像一场雨,
你打着伞,
也只是避免被浇个透心凉。
但伞是破的,
你迟早会湿。
」
作者:南川、Ima
本文通过实测对比,揭示了ChatGPT降智与正常状态下的明显差异,特别是在图像生成等高级功能方面。
作者深入分析了自2024年11月以来ChatGPT降智现象的发展历程,并通过编程方式自动化测试不同IP节点的效果。
研究证实了两个关键发现:一是IP健康度网站scamalytics.com的评分与降智现象无明显相关性;二是影响ChatGPT是否降智的核心因素排序为IP品质 / 账号健康度 / 客户端类型。
文章提供了两种实用的降智测试方法:工具调用检测和封面生成测试,并给出了防止降智的最佳实践建议。
# 本文目录:
- 降智与否的对比
- 降智的直观表现
- 降智的条件背景
- 1. 2024年11月初:降智现象初现
- 2. 2024年12月初:降智问题引发广泛讨论
- 3. 2024年12月中旬:降智蔓延至全客户端
- 我采用的降智测试
- 测试一:工具调用
- 测试二:封面生成
- 实测:scamalytics.com 的 IP 健康度与账号没有关系
- 实测:Pow(工作证明量)也和降智与否关系不大,手机 web 版也无法防止降智
- 关于降智的解决方案排序
先直观感受一下降智与否对输出的影响,这在 gpt-4o 支持最新的生图功能后,与上一代的 dalle 效果差异极大(犹记得一两年前我们还在微信机器人内接 dalle 模型很开心,当时还没朋友吐槽了,其实实在不能看)。
很显然,正常版生图的效果,已经达到生产可用级别,我已经大量用于文章封面、插图生成了,在那之前用的是 midjourney,再在那之前则是用的 canva 或者找平面设计师。
这一波,初级平面设计师真地哭晕在了厕所,不得不厚葬了。
我搜寻了一些测试方法。
有一种办法是测试一道数学题或者日语题,但我感觉太麻烦了,没有兴趣。
还有一种办法是先发一张图片据说就能解封,但我实测是没用的(也可能是失效了)。
我目前采用如下两种办法进行降智测试。
第一种,是在 gpt-4o
模式下,询问:「summarize your tool in a markdown table with availability」。
这个问题在很多个教程里都有提(比如:[ChatGPT 被"降智"怎么办?O1 不思考,4o 不能联网、分析图片和处理文件!](https://www.youtube.com/watch?v=uQ8ExarQhyM "ChatGPT 被"降智"怎么办?O1 不思考,4o 不能联网、分析图片和处理文件!")),确实有效。
对比如下:
值得注意的是,有很多教程说,当工具调用低于 4 个的时候是降智,这个也是一种过时的说法,因为工具肯定会越来越多。
但总体原则是很简单的:账号越尊贵/健康,则能调用的工具越多、且越高级;尤其是越高级的工具,越贵,越要做限制。
在目前(2025 年 04 月 14 日)gpt-4o 下最贵也最火的工具场景就是 gpt-4o 的文生图能力(image_gen
,参考: GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批 AI 侮辱生命),所以可以把这个工具的有无当做是否降智的标准之一。
第二种非常实用(独创),就是给定我的一篇文章,然后让 gpt-4o 给我输出一个封面。
使用 dalle 和使用 gpt-4o 生成的图片风格差异很大(尤其是在饱和度、布局、文本内容上)。
在账号健康、使用 Mac 客户端的情况下,目前唯一能影响是否被降智的因素就剩 IP 了。
我原先也非常下意识地认为 scamalytics.com 的 IP 健康度 将与减少降智的几率呈显著的正向关系。
于是,我为了快速地选出最健康的 IP,我让 cursor 给我写了一个较为复杂的程序,它会自动遍历我们 clash 配置文件里的 vmess 节点列表,然后自动解析出具体的 IP,再自动地查询 scamalytics.com 以获得健康度,最终汇总成表格。
以下是对 cursor 的核心 prompt:
@config.yaml:L29-30
当 proxy 设置为 阿根廷 A 时,网站显示 ip 是 82.152.6.214
当设置为韩国 A 时,显示是 125.240.80.85
想知道我们怎么从这个配置文件程序化地得到 ip
---
@get_real_proxy_ip.py 似乎是可行的,但是得一个个手动切换 proxy,这个不适合批量
---
再得到 ip 之后,再增加一个风险指数检测,例如访问 https://scamalytics.com/ip/125.240.80.85 ,会在源代码里得到:
{
"ip":"125.240.80.85",
"score":"50",
"risk":"medium",
"is_blacklisted_external": false,
...
}
将其信息提取出来
核心程序开源在:git@github.com:MarkShawn2020/2025-04-14_ip-research.git
然后基于我的某个付费服务商 A 进行测试,得到了一张表格:
python proxy_ip_cli.py -c data/config_miaomiao.yaml -a -f both
结果我从风险度最低为 0 的台湾、美国,到超过 10 的台湾、到 100 的土耳其,全都通过了降智测试……
我非常困惑!
于是,我又对我的另一个免费服务商 B 进行测试,得到了另一张表格:
python proxy_ip_cli.py -c data/config_bitz.yaml -a -f both
结果大失所望!
第二张表里即便是风险度为 0 的 结点 / IP,也完全无法通过测试!
基于此,我很明确得到了一个非共识:
降智与否与 scamalytics.com 网站的 IP 风险度没有任何关系。
ChatGPT 确实会考虑 IP 的问题,但是 scamalytics.com 还没有资格做这个判官。
具体就不展开了,但很确信,不构成有效条件
|
||
|
||
|
||
|
||
|
||
|
||
|
结论: 最有效的方法是使用优质的账号(非共享、非多 IP、尽量不多开)、优质专线 IP和稳定的客户端(如 Mac 版或移动端,而非网页版)。
此处,插一嘴,某种意义上,如果通过镜像站固定住账号、IP,甚至客户端,也许确实会比官方账号更稳定(前提是量不大,量大了,千斤都顶不住:)
ok,本期研究到此为止,如果您还有什么问题,欢迎联系我,祝您工作顺利!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-09
OpenAI升级AI编码能力!深度研究代理打通GitHub,Codex支持智能体循环分析改进
2025-05-09
解密NVIDIA团队的代理式AI技术实践
2025-05-09
Cursor创始人深度访谈:AI 如何重塑编程的未来与实践
2025-05-09
大模型人工智能Agent到底是什么,一文搞懂智能体相关概念及原理
2025-05-09
【深度】如何通过MCP实现多智能体之间的协同
2025-05-09
【Cursor实战】Cursor+两个MCP复刻一个简单的Manus
2025-05-09
一口气讲清楚:AI Agent发展史
2025-05-09
【聊一聊】LLM、MCP、Agent
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-05-09
2025-05-08
2025-05-07
2025-04-30
2025-04-29
2025-04-29
2025-04-29
2025-04-28