8月1日,Black Forest Labs推出了FLUX.1图像生成模型。

其官网放出的ELO评分超越Midjourney-V6.0、Stable Diffusion3-Ultra,即使是开源的FLUX.1 [schnell]版本也超越了Midjourney-V6.0和Dall-E 3 HD.

图片

FLUX模型可以扫描下方,免费获取

在这里插入图片描述

FLUX.1 的3个版本

  • FLUX.1 [pro]:FLUX.1 的佼佼者,提供最先进的性能图像生成,具有顶级的提示跟随、视觉质量、图像细节和输出多样性。可以通过Black Forest Labs的 API 注册 FLUX.1 [pro] 访问权限。
  • FLUX.1 [dev]:FLUX.1 [dev] 是一个用于非商业应用的开放权重、指导蒸馏模型。获得了相似的质量和快速粘附能力,同时比相同尺寸的标准模型效率更高。
  • FLUX.1 [schnell]:是可以商用的开源模型,专为本地开发和个人使用设计。

图片


为什么FLUX.1能这么diao?

那就得说说他们的创始人了。

他们的创始人就是Stability AI的前首席科学家Robin Rombach。

就是他带着团队整出了全球闻名的Stable Diffusion项目。所以,要说Rombach在AI图像生成这块地界上,那绝对是资深的老司机级别的。

VQGAN、Taming Transformers和Latent Diffusion这些著名的架构也都出自他手。

他在今年3月份从Stability AI离职,然后创立了Black Forest Labs。

这才短短5个月不到,就发布了他们的产品,你说diao不diao!


技术方案:

大规模的Transformer驱动流模型

所有公开的FLUX.1模型都基于混合架构,结合了多模态和平行扩散Transformer块,并扩展到了120亿参数。通过构建流匹配来改进先前的扩散模型,这是一种训练生成模型的一般且概念简单的办法,扩散作为一种特殊情况被包含在内。此外,他们通过加入旋转位置嵌入和并行注意力层来提高模型性能和硬件效率。

新的图像合成基准

FLUX.1定义了图像合成的新基准。他们的模型在各自类别中设定了新标准。FLUX.1 [pro]和[dev]在以下方面超越了流行的模型,如Midjourney v6.0、DALL·E 3 (HD)和SD3-Ultra:视觉质量、提示遵循、大小/比例变化、版式设计和输出多样性。FLUX.1 [schnell]是目前最先进的少量步骤模型,不仅超越了同类竞争对手,而且还超越了像Midjourney v6.0和DALL·E 3 (HD)这样的强非蒸馏模型。他们还特别针对保留预训练期间产生的全部输出多样性进行了微调。与当前的最先进技术相比,它们提供了显著改进的可能性,如下所示。

图片


那么说了那么多,效果怎么样呢?

图片

示例1

提示词:

Write this poem with cursive text on a background that fits the words:

Roses are red

Violets are blue,

Sugar is sweet

And so are you.

图片

示例2

提示词:

A tense diplomatic negotiation in a grand hall, featuring representatives from 20 different countries, each wearing traditional attire. The scene should include interpreters, aides whispering to their leaders, and visible emotional reactions ranging from frustration to hope.

图片

示例3

提示词:

Artistic interpretation of the human consciousness and subconsciousness

图片

示例4

提示词:

A dark-haired woman in her early thirties playing the piano accordion in the middle of an octagonal wooden dance floor with a wooden roof in the swedish forest, surrounded by dancers dancing in pairs

图片

示例5

提示词:

two cute spiders in victorian outfits having a miniature tea party with a tiny table and teapot on a leaf, macro photo

图片


Black Forest Labs的野心不止如此,他们还宣布要为所有人提供最先进的文本到视频

图片

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

(全套教程文末领取哈)
在这里插入图片描述

👉AI绘画必备工具👈

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉12000+AI关键词大合集👈

在这里插入图片描述

这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

尧米是由西云算力与CSDN联合运营的AI算力和模型开源社区品牌,为基于DaModel智算平台的AI应用企业和泛AI开发者提供技术交流与成果转化平台。

更多推荐