我要投稿

哪里不对改哪里！全能图像编辑模型Qwen-Image-Edit来啦

发布日期：2025-08-19 06:53:02 浏览次数： 3294

作者：通义千问Qwen

微信搜一搜，关注“通义千问Qwen”

我们很⾼兴推出 Qwen-Image-Edit，Qwen-Image的图像编辑版本。Qwen-Image-Edit基于我们20B的Qwen-Image模型进⼀步训练，成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域，实现了对图片中文字的精准编辑。此外，Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL（实现视觉语义控制）和VAE Encoder（实现视觉外观控制），从而兼具语义与外观的双重编辑能⼒。如需体验最新模型，欢迎访问 Qwen Chat （chat.qwen.ai）并选择“图像编辑”功能。

Qwen-Image-Edit的主要特性包括：

语义与外观双重编辑: Qwen-Image-Edit不仅⽀持low-level的视觉外观编辑（如元素的添加、删除、修改等，要求图片其他区域完全不变），也支持 high-level 的视觉语义编辑（如 IP 创作、物体旋转、风格迁移等，允许整体像素变化但保持语义一致）。
精准⽂字编辑: Qwen-Image-Edit 支持中英文双语文字编辑，可在保留原有字体、字号、风格的前提下，直接对图片中的文字进行增、删、改等操作。
强⼤的基准性能: 在多个公开基准测试中的评估表明，Qwen-Image-Edit 在图像编辑任务上具备SOTA性能，是一个强大的图像编辑基础模型。

地址：

ModelScope：

https://modelscope.cn/models/Qwen/Qwen-Image-Edit

Hugging Face：

https://huggingface.co/Qwen/Qwen-Image-Edit

GitHub：

https://github.com/QwenLM/Qwen-Image

示例展示

Qwen-Image-Edit的一大亮点在于其强大的语义与外观双重编辑能力。所谓语义编辑，是指在保持原始图像视觉语义不变的前提下，对图像内容进行修改。

原创IP编辑

我们以Qwen的吉祥物——卡皮巴拉为例，来直观展示这一能力：

可以看到，虽然编辑后的图像大多数像素与输入图像（最左侧的图）都不一样，但依然完美地保持了卡皮巴拉的角色一致性。Qwen-Image的强大的语义编辑能力使其能够轻松地进行原创IP的多样化创作。

更进一步的，我们在Qwen Chat上围绕MBTI十六型人格，设计了一系列编辑prompt，成功地基于吉祥物卡皮巴拉，完成了MBTI表情包的制作，轻松地拓展了IP。

视角转换

此外，视角转换同样是语义编辑中的一个重要应用场景。如下方两张示例图所示，Qwen-Image-Edit不仅能够实现物体的90度旋转，还可以完成180度旋转，让我们直接看到物体的背面：

风格迁移

语义编辑的另一个典型应用是风格迁移。例如，输入一张人物头像，Qwen-Image-Edit可以轻松将其转换为吉卜力等多种风格，这在虚拟形象创作等场景中极具价值：

新增、消除、重绘

除了语义编辑，外观编辑也是常见的图像编辑需求。外观编辑强调在编辑过程中保持图像的部分区域完全不变，实现元素的增、删、改。下图展示了在图片中添加指示牌的案例，可以看到Qwen-Image-Edit不仅成功添加了指示牌，还生成了相应的倒影，细节处理十分到位。

下方是另一个有趣的例子，展示了如何在图片中删除细小的头发丝等微小物体。

此外，还可以对图像中指定的字母“n”进行颜色修改，将其变为蓝色，实现对特定元素的修改。

⼈物背景调整、服装修改

外观编辑在人物背景调整、服装更换等场景中同样有着广泛的应用，下面三张图片分别展示了这些实际应用场景。

英文文字编辑

Qwen-Image-Edit的另一大亮点在于其准确的的文字编辑能力，这得益于Qwen-Image在文字渲染方面的深厚积累。如下所示，以下两个案例直观展示了Qwen-Image-Edit在英文文字编辑上的强大表现：

中文海报编辑

Qwen-Image-Edit同样能够直接对中文海报进行编辑，不仅可以修改海报中的大字，连细小的文字也能精准调整。

链式编辑

最后，让我们通过一个具体的图像编辑案例，演示如何利用链式编辑的方式，逐步修正Qwen-Image生成的书法作品中的错误：

在这幅作品中，有不少汉字存在生成错误。我们可以借助Qwen-Image-Edit，逐步修复它们。例如，可以在原图中用方框标注出需要修改的区域，指示Qwen-Image-Edit针对这些部分进行修正。这里，我们希望红框内正确地写出“稽”字，蓝色区域正确地写出“亭”字。

但实际操作中，“稽”字较为生僻，模型未能一次性完成修改。“稽”的右下角应为“旨”而非“日”。此时，我们可以进一步用红框圈出“日”的部分，让Qwen-Image-Edit对该细节进行微调，将其改为“旨”。

是不是很神奇？通过这种链式、逐步的编辑方式，我们可以持续修正错字，直至获得理想的最终效果。

最终，我们成功获得了完全正确的兰亭集序书法版本！

未来展望

综上，我们希望Qwen-Image-Edit能够进一步推动在图像生成领域的发展，真正降低视觉内容创作的技术门槛，激发更多创新应用的可能。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-24

当软件不值钱了以后，最稀缺的资源是什么？

2026-02-24

OpenAI Codex负责人：我们熟悉的编程方式正在终结 | Jinqiu Select

2026-02-24

OpenClaw 最佳实践：5条“基本原则”

2026-02-24

春节归来第一天，Second Me 做了一个「Agent 互联网的 App Store」

2026-02-24

万字深度解读 MCP Apps：重构 Web 应用，开启 AI 助手的“小程序”时代。

2026-02-24

AI Agent系列｜什么是 ReAct Agent？

2026-02-24

刚刚，Anthropic深夜大点名，这三家中国公司进行蒸馏攻击？！

2026-02-23

Claude Code如何突破白领工业革命

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

独家实录｜唐杰、杨植麟、林俊旸、姚顺雨...All Star 对话上，大家聊了啥？

2026-01-10

2026 开年 AI 工具推荐，让你新的一年效率起飞！（建议收藏）

2026-01-01

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

Codex 史诗级更新！引入 Skills 技能库，直接兼容 Claude 生态，开发效率原地起飞

2025-12-09

深度解读：OpenClaw 架构及生态

2026-02-03

Claude赢麻了？OpenAI Codex正式支持Skills，GitHub连夜上车！

2025-12-21

终于！Gemini CLI支持Agent Skills，一键搬运Claude Code的“绝招”

2026-01-09

Claude Code Skills 国内实践全指南：从安装部署到高阶开发

2026-01-09

从安装到运行：手把手教你用Clawdbot完成第一个智能任务

2026-01-27

大家都在问

当软件不值钱了以后，最稀缺的资源是什么？

2026-02-24

AI Agent系列｜什么是 ReAct Agent？

2026-02-24

OpenClaw "卷"疯了！四天3版！2.14-2.17 版本更新了啥？

2026-02-20

一切皆可Agent Skills，无处不在的AI Agent会替代业务流程吗？

2026-02-14

context是什么？怎么用？

2026-02-13

模型能力、提示词、Skill、工作流、Vibe Coding——到底都是什么？

2026-02-12

谷歌Chrome深夜爆更，Agent不用「装」人了！前端最后防线崩了？

2026-02-12

刚刚，DeepSeek悄悄测试新模型：百万token上下文、知识库更新，V4要来了？

2026-02-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean