评分超越MJ和SD的AI绘画模型FLUX.1，实例到底如何？（附体验地址）

FLUX.1 [dev]：FLUX.1 [dev] 是一个用于非商业应用的开放权重、指导蒸馏模型。获得了相似的质量和快速粘附能力，同时比相同尺寸的标准模型效率更高。

AI绘画哇哒哒

1155人浏览 · 2024-08-06 11:15:50

AI绘画哇哒哒 · 2024-08-06 11:15:50 发布

8月1日，Black Forest Labs推出了FLUX.1图像生成模型。

其官网放出的ELO评分超越Midjourney-V6.0、Stable Diffusion3-Ultra，即使是开源的FLUX.1 [schnell]版本也超越了Midjourney-V6.0和Dall-E 3 HD.

FLUX模型可以扫描下方，免费获取

在这里插入图片描述

FLUX.1 的3个版本

FLUX.1 [pro]：FLUX.1 的佼佼者，提供最先进的性能图像生成，具有顶级的提示跟随、视觉质量、图像细节和输出多样性。可以通过Black Forest Labs的 API 注册 FLUX.1 [pro] 访问权限。
FLUX.1 [dev]：FLUX.1 [dev] 是一个用于非商业应用的开放权重、指导蒸馏模型。获得了相似的质量和快速粘附能力，同时比相同尺寸的标准模型效率更高。
FLUX.1 [schnell]：是可以商用的开源模型，专为本地开发和个人使用设计。

为什么FLUX.1能这么diao?

那就得说说他们的创始人了。

他们的创始人就是Stability AI的前首席科学家Robin Rombach。

就是他带着团队整出了全球闻名的Stable Diffusion项目。所以，要说Rombach在AI图像生成这块地界上，那绝对是资深的老司机级别的。

VQGAN、Taming Transformers和Latent Diffusion这些著名的架构也都出自他手。

他在今年3月份从Stability AI离职，然后创立了Black Forest Labs。

这才短短5个月不到，就发布了他们的产品，你说diao不diao！

技术方案:

大规模的Transformer驱动流模型

所有公开的FLUX.1模型都基于混合架构，结合了多模态和平行扩散Transformer块，并扩展到了120亿参数。通过构建流匹配来改进先前的扩散模型，这是一种训练生成模型的一般且概念简单的办法，扩散作为一种特殊情况被包含在内。此外，他们通过加入旋转位置嵌入和并行注意力层来提高模型性能和硬件效率。

新的图像合成基准

FLUX.1定义了图像合成的新基准。他们的模型在各自类别中设定了新标准。FLUX.1 [pro]和[dev]在以下方面超越了流行的模型，如Midjourney v6.0、DALL·E 3 (HD)和SD3-Ultra：视觉质量、提示遵循、大小/比例变化、版式设计和输出多样性。FLUX.1 [schnell]是目前最先进的少量步骤模型，不仅超越了同类竞争对手，而且还超越了像Midjourney v6.0和DALL·E 3 (HD)这样的强非蒸馏模型。他们还特别针对保留预训练期间产生的全部输出多样性进行了微调。与当前的最先进技术相比，它们提供了显著改进的可能性，如下所示。

那么说了那么多，效果怎么样呢？

示例1

提示词：

Write this poem with cursive text on a background that fits the words:

Roses are red

Violets are blue,

Sugar is sweet

And so are you.

示例2

提示词：

A tense diplomatic negotiation in a grand hall, featuring representatives from 20 different countries, each wearing traditional attire. The scene should include interpreters, aides whispering to their leaders, and visible emotional reactions ranging from frustration to hope.

示例3

提示词：

Artistic interpretation of the human consciousness and subconsciousness

示例4

提示词：

A dark-haired woman in her early thirties playing the piano accordion in the middle of an octagonal wooden dance floor with a wooden roof in the swedish forest, surrounded by dancers dancing in pairs