最近一年,AI 作图几乎成了增长最快的 AI 应用之一。但是我发现一个有意思的现象。大家讨论最多的还是:Midjourney 、Flux 、Stable Diffusion 、GPT Image ,讨论的内容也基本集中在Prompt 怎么写?模型哪个好?出图真实吗?但是如果真正做过电商,就会发现这些问题反而越来越不重要。

真正影响商品图片生产效率的,并不是模型,而是 Workflow(工作流)

AI 作图正在进入第二阶段

我把目前 AI 作图的发展简单分成两个阶段。

第一阶段:Generation(图片生成)

这一阶段,大部分模型解决的是:

PromptImage GenerationOutput

整个流程只有一次 Generation。

模型负责根据 Prompt 输出图片。

这一阶段最重要的是:Prompt Engineering 、模型能力 、出图质量 、艺术风格,所以 Midjourney、Stable Diffusion 能快速发展。

第二阶段:Workflow(工作流)

但是到了电商领域以后。问题开始发生变化。

运营真正需要的是上传一个商品。最后得到的是:白底图、商品主图 、卖点图 、商品详情图 、场景图 、尺寸图 、营销图 ……

这里已经不是一次 Image Generation 可以解决的问题。

它更像一个 Pipeline。

例如:

商品素材

Subject Extraction(主体识别)

Subject Consistency(主体一致性)

Background Rendering(背景生成)

Scene Composition(场景组合)

Marketing Layout(营销图)

Output

整个过程实际上包含多个 AI 节点。真正复杂的是整个 Pipeline。

而不是某一个模型。

为什么电商 AI 作图比普通 AI 生图复杂?

很多人觉得AI 生图和AI 商品图没有区别。实际上区别非常大,普通 AI 作图更关注:Image Quality。而商品图片更关注:Subject Consistency。

例如:

今天生成一个杯子。

下一张:杯把没了、Logo变了、颜色偏了、尺寸比例变了。对于艺术创作来说没有问题。但是对于商品图片来说这是完全不能接受的。

所以现在越来越多电商 AI 作图开始强调:

Subject Consistency(商品主体一致性)

而不是单纯提升画质。

Prompt Engineering 为什么越来越不重要?

去年大家还在卷 Prompt。

例如:masterpiece、best quality、ultra realistic、8K、cinematic lighting

几百个 Token,一句 Prompt 写半天。但是今年开始越来越多平台开始隐藏 Prompt。原因很简单。Prompt 已经被 Workflow 封装了。

例如:

用户上传商品。

系统自动识别主体。

自动分析商品类型。

自动推荐场景。

自动生成商品图。

整个过程用户甚至不用写 Prompt。这其实就是 Workflow 在替代 Prompt Engineering。

电商 AI 作图更像一个 Multi-stage Pipeline

如果从工程角度理解。商品图片生成已经不是:Text-to-Image。

而是:Image-to-Image + Context Understanding + Pipeline。

例如:

第一步识别商品。

第二步锁定主体。

第三步生成背景。

第四步营销排版。

第五步输出不同尺寸。

每一步都可能调用不同能力。

最后形成一整套商品图片,所以很多人觉得:AI 作图越来越聪明,其实不是。而是 Workflow 越来越完整。

为什么开始出现越来越多垂直 AI 作图平台?

这也是我最近观察比较明显的一点。以前大家都在卷模型、现在开始卷行业。

例如:AI 写代码、AI 视频、AI 办公、AI 客服、AI 作图也是一样。

开始出现:建筑 AI、室内 AI、服装 AI、电商 AI。说明模型正在进入行业应用阶段。模型越来越通用。行业 Workflow 反而成为新的竞争点。

最近体验电商 AI 作图的一点感受

最近在研究电商 AI Workflow 的时候,也体验了几款偏商品图片方向的平台。

其中比较有意思的是甩手图省事。它没有把重点放在"模型参数"或者"Prompt",而是把很多商品图片流程提前封装好了。例如围绕同一件商品,可以继续完成:

  • AI商品套图
  • AI商品主图
  • AI营销图
  • AI详情图
  • 商品尺寸图
  • SKU数量图
  • 自由生图

底层依然调用不同模型能力,但对于运营来说,更像是在操作一个完整的商品图片 Workflow,而不是直接面对 AI 模型。我觉得这也是未来很多垂直 AI 产品的发展方向:

用户关心的是业务结果,而不是模型本身。

写在最后

未来 AI 作图的竞争,我认为不会只是模型之间的竞争。Midjourney、GPT Image、Flux 等模型仍然会持续发展。但对于企业和行业用户来说,更重要的是:谁能够把模型能力组织成真正可落地的 Workflow。

电商需要的也不只是"一张图片",而是一整套稳定、可复用、可批量生产的商品图片流程。所以,与其讨论"哪个 AI 模型更强",不如开始思考:

如何让 AI 真正融入自己的业务 Workflow。

延伸阅读

如果你关注的是 AI 在电商商品图片中的实际应用,可以了解一下像甩手图省事这类面向电商场景的 AI 作图平台,它们更关注商品图片 Workflow,而不是单纯的 AI 生图,对于理解垂直 AI 产品的发展方向也有一定参考价值。
https://image.shuaishou.com/#/?inviteCode=HzdSDd

更多推荐