微信扫码
添加专属顾问
我要投稿
AI绘图中文呈现不再难!通义千问Qwen-Image模型让古诗词意境与文字完美结合。核心内容: 1. AI绘制中文的历史痛点与GPT-4o的局限性 2. 通义千问Qwen-Image模型突破性效果展示 3. 从ChatGPT提示词优化到最终成图的完整工作流
还在愁 AI 经常画不出能看的汉字吗?最近我发现了一个新工具,效果非常惊艳。
在很长一段时间里,我用 AI 画画时都不敢在里面放汉字。一旦汉字出现,你立即就能判断这是 AI 画的 —— 那画出来的字简直如同西夏文一般。看着挺眼熟,却完全无法解读出任何意思。在当时,汉字几乎和人物手指数量一样,成为了判别 AI 绘图的「金标准」。
直到 GPT-4o 出现,我们才真正发现中文可以在 AI 绘图中正常生成。尤其是那种画出来跟手写涂鸦卡片一样的东西,又有图片又有文字,给人的感觉就是手绘的。每次我给大家展示并告诉他们这是一行提示词生成的,他们都非常惊讶。
只不过,你要是以为这个功能每次都能成功,稳定性强,那就错了。GPT-4o 里面绘制中文,需要「抽卡」,也就是碰运气。而且,抽中的概率还真不算高。
例如上面这张图里,你一眼就发现了吧?「蛔虫」写成了「蛙虫」,「背景」被写成了「青景」。
再来看一个更典型的失败案例。
这张图你能猜出我想表达什么吗?其实我让它写的文字内容是「人工智能是你的帮手,不该成为你的枪手」。
这已经是抽卡很多次中比较好的一个了。你看下面这张,根本不认识的汉字又出现了:
唉。
有时候,我更希望在图里表现出古诗词的意境。
比如我在《得到》上听熊逸老师讲《资治通鉴》,对下面这首诗感触特别深,所以要求 AI 给我画出来。
我输入:
用中国国画,展现这首诗:归自沙丘后,因专定策功。国由中府令,帝在望夷宫
这是 GPT-4o 给我呈现的结果:
乍看上去,还真像那么回事。但如果你仔细看,会发现那首诗已经被改得不像样子:
所以现在我在图画里加汉字,一般都属于迫不得已的情况。大部分时间,谁也不愿意去露怯。
现在, AI 可以把同样一首诗词表现成这个样子:
我把这幅图发在知识星球里,星友们特别惊喜,想听我讲讲如何绘制:
今天这篇文章,咱们就来谈谈如何用 AI 呈现古诗词 —— 不仅有意境,也有诗词本身。最终,画成你现在看到的这个样子。
绘制的第一步在 ChatGPT 中进行。我们需要让 ChatGPT 告诉我们该以什么样的提示词来描述古诗词,越细致越好。
我的提示词是:「帮我用一段话,细致描写出下面这首诗:归自沙丘后,因专定策功。国由中府令,帝在望夷宫。画面感十足,可以有分镜」
这是 ChatGPT (GPT-5) 给出的结果:
然后你打开 通义千问[1] 的对话界面,选择 Image Generation 图片生成:
没错,咱们这篇文章介绍的新绘图模型,就是通义千问的 Qwen-Image。
感兴趣的话,你可以 读它的技术报告[2]。但是闲言少叙,咱们还是专注于它的用法和效果。
注意,刚才我们从 ChatGPT 获得的提示词描述了场景,但却没有加上这首诗本身。所以我的提示词整体是这样:
「选择合适的风格,描绘下面意境:"在苍白预示不祥的天空下,荒凉沙丘尽头停着载着秦始皇秘密驾崩的庄严马车,疲惫的士兵与官员神情阴沉、满是焦虑;画面转入富丽却紧张的中府,宦官赵高手持诏书,狡猾而威严地掌控权力,群臣卑躬屈膝;再转至望夷宫,秦二世孤立无援、神情绝望,身边仅有惊恐的侍从,命运将尽。整体以泥土灰黄、帝王黄与深蓝紫色交织,融入破碎玉器、散落卷轴等细节,表现权力斗争、阴谋与帝国衰落的悲剧感。"。注意,在图上配以下诗句,草书 "归自沙丘后,因专定策功。国由中府令,帝在望夷宫"。」
注意其中「选择合适的风格,描绘下面意境」这句话很重要。毕竟在绘画艺术上,AI 比我懂得多得多。
接着,我们把做好的提示词输入进去:
你可以选择图片的比例。里面有若干选项,默认是 1:1,但我一般更喜欢选择 16:9,因为适合作为封面或者插图。
很快,千问就绘制出来了:
再次放大一下。
咱们再试一首韩愈的《左迁至蓝关示侄孙湘》:
「一封朝奏九重天,夕贬潮州路八千。欲为圣明除弊事,肯将衰朽惜残年!云横秦岭家何在?雪拥蓝关马不前。知汝远来应有意,好收吾骨瘴江边。」
还是先让 ChatGPT 把整个场景描述出来:
然后构造给千问的提示词就变成了:
「选择合适的风格,描绘下面用户输入的意境:"清晨,朝阳微露,韩愈的奏折被飞骑急递入层层宫门,直达九重天的皇城深处;殿阁内金碧辉煌,文武百官肃立,气息凝重。转场至黄昏,他却被命贬南荒,潮州在八千里外 —— 檐下细雨,驿馆的封驮文书冰冷如铁。镜头一闪,他曾满怀抱负,欲为圣君拨除积弊,不惜燃尽衰年残力,如今却只剩孤身马前。画面切入秦岭深处,厚重的云雾横亘山脊,将归家的方向吞没;雪花翻涌,压满蓝关的狭道,战马嘶鸣却寸步难行。远处,一位风尘仆仆的侄孙策马而来,神情焦急。韩愈望向他,眼中透出沉静与决绝 —— 像是在嘱托,也像在告别:" 若我客死瘴江,便请收殓我的骸骨。""。注意,在图上配以下诗句,草书" 一封朝奏九重天,夕贬潮州路八千。"」
将其输入到通义千问当中,别忘了选择图片生成:
这是生成的结果:
你感觉怎么样?
试完了正经的艺术创作,咱们下面玩点有趣的 —— 把流行歌曲画成画,并且测试把其中的中文正常地体现。我选择的是最近比较火的那首《大展宏图》。
先在 ChatGPT 中描述场景:
你或许感到奇怪,为什么输入的提示词标点符号都不对?那是因为我用语音输入的。这或许可以称为 "Vibe Prompting" (氛围提示)吧?哈哈。
咱们的提示词也就有了:
「一推开豪华别墅大门,映入眼帘的是水池中那尾金光闪闪的银龙鱼,悠游间泛出富贵象征;客厅背景里,一幅气势磅礴的墨宝四字 "大展鸿图" 赫然入目,仿佛昭示着一番雄心壮志;一旁关公像庄严点头,似在默默护佑财运;嘉宾高声唱起 KTV,喇叭里响起那一句 "别墅里面唱 K,水池里面银龙鱼",节奏明快、直白又朗朗上口。空间里,富丽堂皇与市井香气交织,声音与画面合成一幅 "暴发户式" 豪华日常,让人立马 "听见" 那首曲子的魔性韵律。」
到 千问[3] 里面,把我们刚才从 ChatGPT 当中获得的提示词贴进去,回车执行即可:
通义千问立刻给出了绘制结果。
咱们放大一下,看一看。
我觉得元素很全面。但这幅图是否已经包含了歌词当中的全部信息,还需要验证一下。
验证工作嘛,交给 GPT-5 好了。
我使用了自动路由模式(即让 AI 自动选择最合适的模型来执行任务),所以非常快就得到了结果:
从 GPT-5 的描述来看,画作已经包含了歌曲中的核心元素。
GPT-5 对文化符号、色彩冲击等方面的解读,也印证了画作已充分传达出歌曲的内涵。
通过 ChatGPT 和通义千问的配合,你也可以让 AI 在图画里正常地输出中文了。关键在于先用 ChatGPT 生成详细的场景描述,再到千问中加上诗句或文字要求进行绘制。虽然可能还需要一些「抽卡」运气,但相比之前的「西夏文」时代,AI 绘图中包括汉字的能力已经前进了一大步。
如果你也希望绘制这样的图画,马上动手试试看吧。期待你的反馈,也更欢迎你在留言区展现自己的作品哦。
如果你觉得本文有用,请充电。
如果本文可能对你的朋友有帮助,请转发给他们。
欢迎关注我的专栏「科研利器」[4],以便及时收到后续的更新内容。
点击这个链接加入少数派会员[5],立享 9 折优惠!获得专属会员内容、会员播客以及会员定制周边。在更多的领域和方向帮你打开脑洞,找到新的兴趣点。与少数派一起洞悉当下,探索新知。
通义千问: https://chat.qwen.ai/
[2]读它的技术报告: https://arxiv.org/pdf/2508.02324
[3]千问: https://chat.qwen.ai/c/4e29725a-330a-4d6f-9896-f607abe8c103
[4]我的专栏「科研利器」: https://sspai.com/column/245
[5]点击这个链接加入少数派会员: https://sspai.com/prime/subscription?referral=314606736
[6]未来的写作长啥样?LEX 用 GPT-3 AI 给你点儿颜色看看: https://sspai.com/post/76362
[7]AI 真要成精了?ChatGPT 上手体验: https://sspai.com/post/77081
[8]开源免费 AI 朗读中文,居然也能以假乱真了?: https://sspai.com/post/89264
[9]如何让 ChatGPT 更懂你?新功能 Custom Instructions 尝试: https://sspai.com/post/81470
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-15
含全文!OpenAI发布GPT-5官方Prompt指南
2025-08-15
道理都懂,做到很难!有赞白鸦的分享与AI赋能的启发
2025-08-15
MNN LLM Chat iOS 流式输出优化实践
2025-08-15
优tech分享 | 入局AI Infra:程序员必须了解的AI系统设计与挑战知识
2025-08-15
Kimi-K2模型真实项目OOP重构实践
2025-08-15
腾讯云上新CloudBase AI CLI,可减少80%编码量
2025-08-15
Altair重磅发布:100个AI赋能的工程应用案例,揭示“万物皆可解”的未来
2025-08-15
Windsurf没死!已经彻底Devin化
2025-05-29
2025-05-23
2025-06-01
2025-06-21
2025-06-07
2025-05-20
2025-06-12
2025-06-19
2025-06-13
2025-05-28