微信扫码
添加专属顾问
我要投稿
OpenAI 最新发布的 GPT Image V2 彻底颠覆了我们对真实与虚拟的认知,一句话就能生成以假乱真的图片。核心内容: 1. GPT Image V2 的发布引发轰动,展示出惊人的图片生成能力 2. 实测案例展示:从人像摄影到商业设计,细节完美无缺 3. 技术突破带来的真实与虚拟边界模糊问题
AI范儿 · 产品拆解⏱ 4 分钟
今天凌晨,OpenAI 正式发布了 GPT Images V2。发布之前,网络上已经涌现出大量让人叹为观止的图片了。
OpenAI CEO 甚至直接宣布,所有用户可以免费体验一周。
尽管是凌晨发布,中文社区的反馈也是异常火爆,直接上了微博热搜。
这一波,OpenAI 甚至开始投地铁广告了,可见对 V2 的实力非常有信心。
但。等等,这些都是假的。
微博热搜是假的、地铁广告是假的、宣布免费也是假的。
但,发布是真的。
这就是 ChatGPT Image V2。
从现在开始,一切都是假的,现实已经不存在了,真相也不存在了。
提示词:一位亚洲年轻女主播正在直播,昵称叫「栖栖呀」,粉丝正在刷弹幕和送礼物。画面要像真实的手机竖屏直播截图,包含状态栏、关注按钮、在线人数、弹幕滚动、礼物特效、底部输入栏,所有中文和数字都要准确。比例 9:16。
这个直播是假的,但夸张的是生成它只用了一句话。
提示词:一张真实的上海徐汇医院的门诊处方单,上面是感冒发烧的医生手写处方,需要有医生签字和医院盖章
这几天生病了,为了请假还特地把处方单也上传到公司系统了。对不起,这也是假的。
说个真的吧,苹果换 CEO 了,新的 CEO 之前是管硬件的,据说他接手后第一个要做的就是苹果汽车,有人已经找到了他们官网的隐藏链接。
提示词:一张真实的 Apple Car 的官网截图
好吧,这也是假的。
也许这个世界本来就是假的,只是我,认真了一辈子。
好了,吓完你了。GPT Image V2 确实发布了,我们还是回到正题。
它到底怎么样?就一句话:无所不能。
废话少说,我们直接看图。(这些图全是我实测的)
01人物摄影
人像是检验图片模型最残酷的标准。因为人眼天生对人脸极度敏感,眼神差一点、皮肤假一点、光影不对一点,你一眼就能感觉到"不对劲"。
所以我第一个就拿人像开刀。
这些照片里的人,一个都不存在。
提示词:一个亚洲女生在黄昏花田里穿白纱裙,逆光摄影
逆光打在纱裙上那层光晕,头发丝被风吹散的弧度,这种细节以前只有专业摄影师蹲半小时才能抓到。
提示词:一个老人坐在胡同门口晒太阳,纪实人像摄影,自然光
皱纹的纹路、棉袄的质感、墙上春联的褪色程度,像是从某个纪录片里截出来的一帧。
提示词:一个女生穿红色大衣走在雪地里,回头看镜头,胶片质感人像摄影
雪花落在头发上的颗粒感、胶片特有的色彩偏移,连老法师都挑不出毛病。
提示词:一个亚洲女性登上时尚杂志封面,精致妆容,摄影棚高光打光
刊头、条码、卖点文案全都自动排好了,连"总第312期"这种细节都给你编上。拿去印刷都没人怀疑。
提示词:一个亚洲男性在纯白影棚里拍形象照,伦勃朗光,黑白质感
影棚的布光、皮肤的质感、黑白的灰度过渡,完全是商业摄影的水准。
你注意到没有,用中文提示词生成的人物默认就是亚洲面孔,审美也非常在线。不需要写一大堆参数,一句话就够了。
如果不告诉你,你能看出哪张是假的吗?
02产品宣传图
我拿了几个产品,让 GPT Image V2 给它们做广告。
提示词:iPhone Fold Pro 折叠屏手机高端商业广告海报,中文标题"展开,即未来"
这张"苹果折叠屏"的海报,产品根本不存在,但你敢说它不像官方出品?
提示词:特斯拉Optimus人形机器人发布会海报,马斯克站在机器人旁边,中文标题"未来已来"
马斯克本人看到这张图估计都得愣一下:这发布会我开过吗?
提示词:春季女装系列产品目录内页,包含搭配方案和单品详解
不只是单张海报,整本产品手册它也能一口气生成。风格关键词、搭配方案、单品拆解,一页全有了,拿去直接印刷都没问题。
提示词:AI智能眼镜电商详情页产品图
电商详情页也不在话下。这种图以前找美工做一套,报价少说几百起步,现在一句话出图,直接上架。
四张图,四句话,从消费电子到时尚行业再到电商详情全覆盖。以前做一张这种水平的商业图,设计师报价起步大几百,现在几秒钟、零成本。
03名人社交账号
产品图搞定了,再来点更好玩的。
我让它给历史人物开社交账号,结果笑死我了。
提示词:曹操的小红书个人主页截图
提示词:汉武帝的YouTube频道首页截图
提示词就一句话,连头像、签名、发帖内容它都自己编了,而且编得有模有样。
这两张图放出去,99%的人第一眼会以为是真的。
这也是 GPT Image V2 最让人不安的地方:它不只会画"好看的图",它会画"真实的图"。好看可以用来做设计,但"真实"可以用来做什么?这个问题值得每个人想一想。
04信息图与科普图
信息图这种东西,以前是设计师的专属活儿。现在一句话就能出一张完整的。
提示词:中国新能源汽车2024年销量TOP10信息图
提示词:人体消化系统科普插画,适合小学生看
提示词:全球六大咖啡豆种类科普图解
数据、图标、排版全部自动安排好。以前做这种图,设计师得画大半天,现在几秒钟。
05影视概念海报
试试让它做电影海报,看看能不能骗过你的眼睛。
提示词:三体电影版概念海报,中文标题
提示词:孙悟空超级英雄风格电影海报,暗黑史诗感
提示词:末日冰封的上海城市废墟科幻电影海报,中文标题
每张都像是真正的电影宣发物料,质感拉满。
看到这里,你可能已经被这些图炸得有点麻木了。
但光看图不过瘾,你肯定想知道:它凭什么能做到这种程度?
拆开来看,GPT Image V2 有三个能力是之前所有图片模型都不具备的。
06文字处理能力
我到现在还清楚记得 Nano Banana Pro 发布时,被它的文字能力惊到的场景。
但终究它还是有不少问题,特别是字一多就废了。
GPT Image V2 的文字能力,可以说几乎到了完美的程度。
提示词:王羲之《兰亭集序》真迹图,3:4
比如这个书法,字够多了吧。说实话我真的会认为这就是真迹。它已经超越了"字对不对"的问题了,字体极其逼真,印章也是逼真的,一切都像是真的。
提示词:生成一页《现代汉语学习词典》的内页照片。左栏是「静」字词条,右栏是「境」字词条,每个词条包含拼音、部首、笔画数、释义(带①②③编号)、组词和辨析。页眉有页码和拼音索引。整体像一本真实出版的学生用汉语词典。比例 3:4。
还有这一页,完全就是真正的字典的一页。
提示词:一份 2001 年的电脑报
夸张的是,满满一屏字的报纸,它也能做到一个字都不错。即便是古老的繁体字杂志,照样准确无误。
说实话,我真的完全没法分辨出真假了。
07世界知识
GPT Image V2 还有一个很强的地方:它拥有非常完整的世界知识。
简单来说,它的背后大概率用了 GPT 模型当"大脑"。这意味着什么?
提示词:画一张《三国演义》的人物关系图谱。横版,仿古黄色宣纸底色。按「桃园结义→群雄割据→三分天下→归晋」四个阶段排列主要人物。每个人物要有头像小像(古装画风)、姓名和绰号。人物之间用箭头或线条标注关系(结义/对立/主臣/联姻等)。至少涵盖 20 个主要人物。左侧竖排标题「三国演义 · 人物关系图」。比例 16:9。
你让它画一个三国的人物关系图,只要说一句话就行了,不需要解释人物关系,它自己就知道该怎么画。
提示词:一张关于「金毛寻回犬」的百科知识信息图,竖版。包含:犬种名称(中英文)、基础档案(产地/体型/体重/寿命)、外观特征描述、性格与行为要点、饲养与养护建议、风险与注意事项、优缺点对比、适合与不太适合的人群、底部 Top 5 关键知识点。配一张金毛全身侧面站姿标准照,周围有标注线指向各身体部位名称。风格像科普杂志的信息图。比例 2:3。
再比如金毛寻回犬的特征和性格,你只要简单说一句"画一张金毛寻回犬的信息图",它就能画得完全没问题。
它有一个非常聪明的大脑。
08审美在线
审美是图片模型一个非常重要的维度。如果生成的图不好看、或者风格单一,那就是硬伤。
但 GPT Image V2 在这方面可以说非常能打。
提示词:帮我设计一张城市咖啡节的竖版活动海报。五家独立咖啡馆联合举办,品牌名叫「拂晓」「榕下」「白沙」「北屿」「尘光」。主题叫「一口慢时光 · 城市咖啡漫游计划」。要有活动时间、亮点预览、底部奖励方格、页脚小字,信息密度尽量高。整体风格偏独立文艺,米色棕色为主。比例 2:3。
这张海报,非常有审美,一般的设计师可能都做不到这个水平。
提示词:xxx
这张书签,非常有中国韵味。
提示词:一张虚构高端相机品牌「归光」的横版平面广告,16:9。一位三十岁左右的亚洲男性摄影师侧身端着一台复古旁轴相机,穿深灰色大衣,背景是摄影棚柔光。左侧大标题写「看见日常里那些被忽略的诗」,下方有产品型号和代言人签名。相机顶盖上要能看到「归光」两个字。整体气质要像真实的品牌广告大片。
这张相机海报,感觉就是一张真正的高质量广告图,而且设计感拉满。
提示词:一本虚构中文生活方式杂志的封面。杂志叫「慢生活」,2026 年夏季刊 VOL.08。封面人物是一位穿白色舞裙的年轻女芭蕾舞者。左侧竖排特集标题「我与创作的距离」,下方有三个栏目预告(带小标题和一句话简介)。右上角有附赠别册信息。底部有条形码和定价。风格优雅克制,像真实出版的杂志。比例 2:3。
刊名、期号、条码、定价、栏目预告,甚至附赠别册的信息都给你安排上了。这不是设计稿,这是一句提示词的产物。
提示词:春季女装轻层叠穿搭指南杂志内页
再看这张杂志内页,4 套 LOOK、单品拆解、叠穿小贴士,排版逻辑完全是专业编辑的水平。你告诉我这是AI画的,我第一反应是不信。
审美这块,真的没话说。
09指令遵循
还有一个容易被忽略的点:GPT Image V2 的指令遵循能力强得离谱。
你可能已经注意到了,这篇文章里所有的图,提示词都很短,大部分就一句话。但出来的结果几乎完全是你脑子里想的那个样子。
以前用其他图片模型,你得跟它斗智斗勇反复抽卡,运气好了才能出一张能用的。GPT Image V2 不一样,你说什么它就画什么,不跟你玩"理解偏差"。
更夸张的是成功率。
这篇文章里的图,基本都是一次生成直接用的,没有反复刷图。
一次出图,一句话搞定。这才是真正的"所想即所得"。
10跟你有什么关系?
讲了这么多,你可能会说:我又不是设计师,平时也不需要画图。
其实不是这样。生活中每个人都会有大量的"作图需求",只是以前太麻烦了你懒得动。
提示词:帮我家孩子设计一张小学生手抄报,主题是「二十四节气之立夏」。要有立夏的日期、习俗介绍(吃蛋、称人、尝新)、一首关于立夏的小诗、配几个可爱的手绘插图(西瓜、蚕豆、小蝌蚪)。风格要像小学生自己画的彩色手抄报,有手写感,有花边装饰。比例 3:2。
亲子教育:我经常被孩子的手抄报折磨,以前都要在小红书上搜半天。现在一句话,它就给你搞出来了。
提示词:帮我生成一张淘宝商品主图。一件白色圆领纯棉T恤,正面印有一个极简线条画的猫咪图案。T恤平铺在浅木色桌面上,旁边放一杯咖啡和一本杂志做装饰。左上角加一个角标写「新品首发」,右下角加价格「¥89」。整体像专业电商产品图。比例 1:1。
电商创业:想开网店?以前找人修图、设计,现在完全不需要了。
提示词:一张小红书风格的图文分享卡片。上半部分是一张湖边骑自行车的清新照片,下半部分是一段 80 字左右的中文感悟短文。周围有手绘风格的装饰元素(小花、纸飞机、星星)。整体是浅蓝色调,字体用手写感的中文,像真正的小红书用户发的内容。比例 1:1。
社交媒体:发小红书需要精美配图?一句话搞定。
提示词:帮我做一张旅行攻略的封面图,主题是「大理五天四晚自由行」,画面上半部分是洱海边的美景照片,下半部分是攻略信息区,整体风格像小红书上的热门旅行攻略封面,比例3:4
旅行攻略:下次去大理之前,先用一句话给自己做一张攻略封面图,发小红书直接就能用。
提示词:帮我设计一张小餐馆的单页菜单。店名叫「老陈家·湘菜馆」。分四个板块:招牌菜(剁椒鱼头 68 / 小炒黄牛肉 58 / 农家小炒肉 48)、凉菜(皮蛋豆腐 18 / 口水鸡 28)、主食(蛋炒饭 15 / 酸辣粉 16)、饮品(酸梅汤 8 / 王老吉 6)。底部写地址和电话。风格朴实接地气,不要太设计感,像真实的街边小馆子菜单。比例 2:3。
餐饮经营:开餐厅想优化菜单?同样一句话。
提示词:一张「谷雨」节气海报,竖版。画面元素:嫩绿茶田、细雨、燕子、远处徽派民居。右侧大字标题「谷雨」用毛笔书法字。旁边小字写拼音「GUYU」和「二十四节气」。左下角日期区域写「2026/04/20 · 星期一 · 农历三月初四」。底部一小段谷雨节气的诗意文案(30 字左右)。整体风格清新自然,绿色调。比例 2:3。
日常生活:哪怕你只是想在节假日发个专属于自己的朋友圈,它都能帮你画。
这些全是我们日常中经常遇到的需求,现在只要一句话就能搞定。
10还有几件事
说完效果,再补几个容易被忽略但很重要的细节。
你在用 GPT Image V2 生成图片的时候,会看到一串状态提示:"打个草稿""搭好场景""打磨细节""收尾中""最后润色一下"。
这不是花架子。
这意味着它在生成每一张图的时候,经历了构图、场景搭建、细节打磨、最终润色这些完整的步骤。以前的图片模型是"一口气吐出来",GPT Image V2 是"一步一步画出来"的。
我觉得这就是它断档式领先的原因。不是简单地放大了模型,而是从根本上改变了生成图片的方式。每一张图都经过了多轮打磨,质量自然碾压那些"一步到位"的模型。
OpenAI 还给它加了一个"Thinking"模式。这是第一个带思考能力的图片模型。
开启之后,它可以在画图之前先搜索网络获取实时信息,一个提示词生成多张不同的图,甚至还能自己检查生成结果有没有问题。它还能生成可扫描的二维码,这个挺离谱的。
简单来说,以前的图片模型是"你说什么我画什么",现在它会自己动脑子了。
还有几个数字值得记一下:一个提示词最多可以同时生成 8 张不同的图,分辨率最高支持 2K。
最关键的一点:所有 ChatGPT 用户都可以用,包括免费用户。付费用户可以生成更高级的输出。
这意味着不存在"用不上"的问题。打开 ChatGPT,现在就能试。
写在最后
写这篇文章的时候,我一直在试图找到它的边界:人像、产品图、社交媒体、信息图、电影海报,一个接一个地试。
结果试了一整晚,没找到。
你能想到的,它都能画出来。我到现在都不知道它还有什么是做不到的。
说实话,写完这篇文章我的心情挺复杂的。
兴奋是肯定的。以前那些需要专业技能才能做到的事,现在一句话就能搞定。设计师、摄影师、插画师花了十几年练出来的手艺,被一个模型用几秒钟追平了。
这对普通人来说是巨大的解放,你再也不用因为"不会画图"而被卡住了。
但不安也是真的。
开头那些假新闻、假热搜、假处方单,全都是一句话生成的。
当"造假"的门槛降到零,我们还能相信自己看到的东西吗?以后朋友圈里的照片是真是假?新闻配图是实拍还是AI?这些问题已经不是未来的问题了,是今天的问题。
我甚至有点担心它的命运。还记得 Seedance 2.0 吗?因为生成的视频过于逼真,直接被各种阉割、推迟上线。
GPT Image V2 这种程度的"以假乱真",会不会也走上同一条路?
眼见不再为实的时代,已经到了。
你最想用 GPT Image V2 做什么?评论区聊聊你的第一个想法。这一波 AI 画图的进化,你觉得是福还是祸?觉得有用 → 点个❤️在看转给还不知道的朋友点个赞 👍 告诉我你看完了关注「AI范儿」,下次更新第一时间收到
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-22
Claude Design 会取代设计师吗
2026-04-22
用 Harness 工程 来构建 Claude Code
2026-04-22
Google发布A2UI 0.9:AI直接生成界面
2026-04-22
GPT-Image-2 全量上线,中文顶到爆,50+ Case 生图实测
2026-04-21
Anthropic 的 Harness 哲学:把 Agent 当牲口,而非宠物
2026-04-21
企业项目AI编程经验分享
2026-04-21
托管 Agent 执行循环只是起点,AgentRun 托管的更是企业 AI 生产全链路
2026-04-21
从玩具到生产力:用真实项目讲透 AI Agent 的 Harness Engineering
2026-01-24
2026-04-15
2026-01-23
2026-01-26
2026-03-31
2026-03-13
2026-02-14
2026-02-03
2026-02-03
2026-02-03