阿里通义千问又来整新活了。

8 月 19 日,阿里通义千问团队正式发布 AI 图像编辑模型 Qwen‑Image‑Edit

不同于此前 20B 参数的 Qwen‑Image 生图模型,Qwen‑Image‑Edit 主打“修图”,即图像编辑,可以类比 OpenAI 的 GPT Image 原生生图模型。

根据阿里官方介绍,Qwen‑Image‑Edit 支持中英双语文字的精准编辑,并融合语义级(整体理解与自然语言编辑)与外观级(细节精修与局部控制)的双重图像编辑能力。

这意味着,Qwen‑Image‑Edit 不仅可以修改海报上的一行小字:

也可以进行人物视角转换,90°、180° 都可以。


01|从“生成”到“可控编辑”

相比传统扩散模型专注于从零生成图像,图像编辑对模型提出了更高要求:不仅要理解图像的语义,还需具备精细重构的能力。

Qwen‑Image‑Edit 在架构上引入“双模块”机制,通过语义与外观两个维度的协同控制,实现既精准又风格统一的图像修改。

  • 语义控制:由 Qwen2.5‑VL 模块负责,确保编辑符合图像原有的语义逻辑

  • 外观控制:通过 VAE Encoder 保留图像的风格细节,避免非目标区域受到干扰

同时,Qwen‑Image‑Edit 继承了 Qwen‑Image 在中英文文字渲染方面的原生优势,擅长处理排版复杂、文字密集的内容,如中文段落、混排标语。


02|三类核心编辑能力

基于上面的技术原理,Qwen‑Image‑Edit 共有三类核心能力。

  1. 中英文字精准编辑

你可以对图像中的中文或英文文字进行增、删、改、换颜色等操作,且模型会保留原有排版、字体、字号与风格。

比如:

  • 修正书法作品中的错别字

  • 修改宣传海报中的小字说明

  • 调整英文封面中的单词与颜色

支持“链式编辑”,即用框选方式逐步完成复杂多步精修。

  1. 语义级图像改写

Qwen‑Image‑Edit 支持保持语义一致性的前提下,大幅度改变图像视觉内容。

所以,它很适合:

  • IP 创作:同一角色多样风格/动作变化

  • 视角变换:支持 90° / 180° 人物转向

  • 风格迁移:如将头像变为“宫崎骏风格”或“国风水墨”

适用于创意设计、IP 拓展、图像表达再创作等场景。

比如 Qwen 给自己创作的 IP 矩阵,萌萌哒。

  1. 外观级局部修饰

对图像中的局部进行细致调整,确保非目标区域完全不变。

支持:

  • 添加物体(如“加一个站牌 + 自动反射”)

  • 删除杂物(如“去除头发丝、背景干扰”)

  • 局部色彩替换(如“把 logo 中的 n 变蓝色”)

这类操作适用于视觉审美优化、品牌统一化设计等需求。


03|如何体验与调用?

在线(推荐):

  • Qwen Chat :https://chat.qwen.ai/?inputFeature=image_edit

  • Hugging Face Spaces :https://huggingface.co/spaces/Qwen/Qwen-Image-Edit

API 调用:

  • 调用地址 :https://www.alibabacloud.com/help/en/model-studio/qwen-image-edit-api

  • 模型名:qwen-image-edit

  • API 定价:$0.045 /张;免费额度 100 张(180 天有效)


04|Qwen‑Image‑Edit 实测

从官方给出的案例来看,Qwen‑Image‑Edit 还是很有实力的。

实测一波。

提示词:优化公众号 AI信息Gap 的头像,风格简洁现代,突出科技与未来感,体现人工智能和信息连接主题。采用冷色调(蓝色、银色),可加入电路、数据流、光效等抽象科技元素,整体专业且辨识度高。

附上优化前后的头像对比。

左边是原图,右边是 Qwen‑Image‑Edit 优化的头像。

整体来看表现还算不错。文字编辑是 Qwen‑Image‑Edit 的优势之一,这次实测中也体现得比较明显。指令响应和风格保持也还过得去,比如虚拟人头的轮廓与形状保持了一致性。


结语

作为一个 20B 参数的模型,Qwen‑Image‑Edit 的表现“可圈可点”。

真要让它和 OpenAI 的 GPT Image,以及疑似谷歌的神秘模型 nano-banana 相比,可能还有点牵强。

但作为平替,应该已经够了。

毕竟免费且开源,还要什么自行车。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

Logo

惟楚有才,于斯为盛。欢迎来到长沙!!! 茶颜悦色、臭豆腐、CSDN和你一个都不能少~

更多推荐