openclaw生态新成员：Nunchaku FLUX.1-dev开源大模型GPU算力适配指南

本文介绍了如何在星图GPU平台上自动化部署Nunchaku FLUX.1-dev文生图镜像，实现高效的AI绘画创作。该平台简化了部署流程，用户可快速搭建基于ComfyUI的AI绘画环境，轻松应用于创意图片生成、艺术设计等场景，显著提升内容创作效率。

魑魅丶小鬼

346人浏览 · 2026-02-28 01:52:22

魑魅丶小鬼 · 2026-02-28 01:52:22 发布

openclaw生态新成员：Nunchaku FLUX.1-dev开源大模型GPU算力适配指南

最近，openclaw生态又迎来了一位重量级新成员——Nunchaku FLUX.1-dev。如果你对AI绘画感兴趣，特别是对ComfyUI这个强大的工作流工具情有独钟，那么这个消息绝对值得你关注。

FLUX.1-dev本身就是一个备受瞩目的文生图模型，以其出色的图像质量和细节表现力在社区中积累了不错的口碑。而Nunchaku团队这次带来的，是专门为这个模型优化的GPU算力适配方案。简单来说，就是让FLUX.1-dev模型在ComfyUI里跑得更快、更稳、更省显存。

这篇文章，我就带你从零开始，手把手完成Nunchaku FLUX.1-dev模型在ComfyUI中的部署和文生图实战。无论你是刚接触ComfyUI的新手，还是想体验最新模型的老玩家，都能跟着步骤一步步搞定。

1. 环境准备：打好基础，事半功倍

在开始安装插件和模型之前，我们需要确保电脑环境已经就绪。这就像盖房子前要打好地基一样，基础稳固了，后续操作才能顺畅。

1.1 硬件要求：你的显卡够用吗？

首先，你得有一块支持CUDA的NVIDIA显卡。这是运行这类AI绘画模型的硬性要求。

推荐配置：显存24GB或以上。这个配置可以让你流畅运行FP16精度的完整模型，享受最佳的图像生成效果。
入门配置：如果你的显卡显存不足24GB（比如8GB或12GB），也完全不用担心。Nunchaku提供了量化版本的模型（如INT4、FP8），它们对显存的要求大幅降低，依然能产出不错的图片，只是可能在极端复杂的细节上略有妥协。

1.2 软件环境：安装必备工具

软件方面，我们需要准备三样东西：

Python 3.10+：这是运行ComfyUI和模型的基础编程环境。
Git：用于从代码仓库克隆安装文件。
PyTorch：深度学习框架，需要安装与你的系统和CUDA版本匹配的版本。通常，安装ComfyUI时会自动处理。

此外，我们还需要一个下载模型的小工具。在开始安装前，先打开你的命令行终端（Windows用户用CMD或PowerShell，Mac/Linux用户用Terminal），输入以下命令来安装它：

pip install --upgrade huggingface_hub

这个huggingface_hub工具能帮助我们更便捷地从Hugging Face平台下载模型文件。

好了，基础环境检查完毕，接下来我们进入正题，开始安装Nunchaku插件。

2. Nunchaku ComfyUI 插件安装部署

Nunchaku为FLUX.1-dev模型开发了专用的ComfyUI插件，我们需要先把它装到你的ComfyUI里。

2.1 安装 ComfyUI-nunchaku 插件

这里提供两种安装方法，你可以根据喜好和实际情况选择一种。

方法A：使用Comfy-CLI（最简单，推荐新手）

如果你希望用最少的命令完成安装，这个方法最适合你。它通过一个统一的命令行工具来管理ComfyUI及其插件。

# 第一步：安装ComfyUI CLI工具
pip install comfy-cli

# 第二步：安装ComfyUI（如果你已经安装过ComfyUI，可以跳过这一步）
comfy install

# 第三步：安装Nunchaku插件
comfy noderegistry-install ComfyUI-nunchaku

# 第四步：移动插件到正确目录（通常CLI会自动处理，如果发现插件未生效，可以手动移动）
# 找到下载的插件文件夹，通常名为 `ComfyUI-nunchaku`，将其移动到你的ComfyUI目录下的 `custom_nodes` 文件夹内，并重命名为 `nunchaku_nodes`。
# 例如：mv ComfyUI-nunchaku /path/to/your/ComfyUI/custom_nodes/nunchaku_nodes

方法B：手动安装（自定义性强，适合进阶用户）

如果你已经有一个现成的ComfyUI环境，或者喜欢自己掌控安装过程，可以选择手动安装。

# 1. 安装ComfyUI（如果已安装，请跳过）
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt

# 2. 克隆Nunchaku插件到custom_nodes目录
cd custom_nodes
git clone https://github.com/mit-han-lab/ComfyUI-nunchaku nunchaku_nodes

无论哪种方法，安装完成后，你的ComfyUI的custom_nodes文件夹里应该会多出一个名为nunchaku_nodes的文件夹。

2.2 安装 Nunchaku 后端

插件本体安装好后，还需要安装其运行所需的“引擎”，也就是Nunchaku后端。从v0.3.2版本开始，这个过程变得非常简单。

启动你的ComfyUI。在ComfyUI的网页界面中，你应该能看到一个新增的节点分类，例如“Nunchaku”。插件通常会提供一个名为install_wheel.json的工作流文件。你只需要在ComfyUI中加载（Load）这个工作流，然后运行（Queue Prompt）它，就会自动完成后端wheel包的安装或更新。

如果找不到这个工作流文件，你也可以在启动ComfyUI后，查看终端输出的日志信息，插件可能会提示你执行特定的安装命令。

插件和后端都搞定后，我们就要请出今天的主角——模型文件了。

3. Nunchaku FLUX.1-dev 模型使用准备

模型文件是生成图片的核心。我们需要下载两类文件：FLUX模型通用的基础组件，和Nunchaku优化过的FLUX.1-dev主模型。

3.1 配置 Nunchaku 工作流

为了方便使用，Nunchaku插件自带了一些示例工作流。我们需要把它们复制到ComfyUI能识别的位置。

打开命令行，进入你的ComfyUI根目录，然后执行以下命令：

# 进入ComfyUI根目录
cd /path/to/your/ComfyUI

# 创建用于存放示例工作流的目录（如果不存在）
mkdir -p user/default/example_workflows

# 复制Nunchaku插件自带的工作流示例到该目录
cp custom_nodes/nunchaku_nodes/example_workflows/* user/default/example_workflows/

完成这一步后，当你启动ComfyUI并点击“Load”按钮时，在弹出的对话框中就能看到这些示例工作流了。

3.2 下载模型文件

这是最关键的一步。请根据你的显卡类型，选择对应的模型版本。

显卡与模型版本对应关系：

Blackwell架构显卡（如未来的RTX 50系列）：请使用 FP4 量化版模型。
其他NVIDIA显卡（如RTX 20/30/40系列）：优先使用 INT4 量化版模型，在效果和速度间取得良好平衡。
显存紧张的用户：如果你的显存较小（如8GB），可以考虑 FP8 量化版的FLUX.1-dev模型，它能在保证不错效果的前提下，大幅降低显存占用。

3.2.1 下载基础FLUX模型（必须安装）

FLUX模型需要两个基础组件：文本编码器（Text Encoder）和VAE（变分自编码器）。我们可以用之前安装的huggingface_hub工具来下载。

在你的ComfyUI根目录下，执行以下命令。工具会自动将模型下载到正确的子目录中。

# 下载文本编码器模型到 models/text_encoders
hf download comfyanonymous/flux_text_encoders clip_l.safetensors --local-dir models/text_encoders
hf download comfyanonymous/flux_text_encoders t5xxl_fp16.safetensors --local-dir models/text_encoders

# 下载VAE模型到 models/vae
hf download black-forest-labs/FLUX.1-schnell ae.safetensors --local-dir models/vae

小提示：如果你已经通过其他方式下载了这些模型，也可以手动创建软链接或直接复制文件到上述目录。例如，检查你的目录结构可能如下所示：

models/
├── text_encoders/
│   ├── clip_l.safetensors
│   └── t5xxl_fp16.safetensors
└── vae/
    └── ae.safetensors

3.2.2 下载 Nunchaku FLUX.1-dev 主模型（核心）

现在来下载最重要的部分——经过Nunchaku优化的FLUX.1-dev模型。

主模型下载：模型需要放置在models/unet/目录下。以下以INT4版本为例：
```
hf download nunchaku-tech/nunchaku-flux.1-dev svdq-int4_r32-flux.1-dev.safetensors --local-dir models/unet/
```
如果你需要FP4或FP8版本，请将命令中的文件名替换为对应的版本，例如svdq-fp4_r32-flux.1-dev.safetensors或svdq-fp8_r32-flux.1-dev.safetensors。
可选：LoRA模型：LoRA是一种轻量化的模型微调技术，可以给生成的图片附加特定风格或效果。Nunchaku工作流支持加载多个LoRA。你可以将下载的LoRA模型（如FLUX.1-Turbo-Alpha）放入models/loras/目录。这不是必须的，但可以丰富你的创作。

模型准备齐全，万事俱备，只欠东风。接下来，我们就启动ComfyUI，开始生成第一张图片。

4. 启动 ComfyUI 并运行 FLUX.1-dev 文生图

4.1 启动 ComfyUI

一切就绪后，启动ComfyUI。在ComfyUI的根目录下，打开命令行，输入：

python main.py

稍等片刻，你会看到终端输出一个本地地址（通常是 http://127.0.0.1:8188）。在浏览器中打开这个地址，就能看到ComfyUI的图形化操作界面了。

4.2 加载 Nunchaku FLUX.1-dev 工作流

在ComfyUI网页界面中，点击左上角的“Load”按钮。在弹出的文件浏览器中，你应该能看到我们之前复制过来的示例工作流。

这里重点使用 nunchaku-flux.1-dev.json 这个工作流。它专为文生图优化，并且支持加载多个LoRA模型，功能最全面，效果也最好。

加载成功后，界面中会出现一系列已经连接好的节点，这就是一个完整的文生图流水线。

4.3 设置参数并生成图片

现在，你可以像操作一台精密的仪器一样，开始调整参数，创造你的图像了。

输入提示词：在工作流中找到标记为“Prompt”或类似名称的文本输入框。FLUX模型对英文提示词的理解通常更好。尝试输入一段描述，例如：A beautiful landscape with mountains and lakes, ultra HD, realistic, 8K（一个美丽的山水风景，超高清，写实风格，8K分辨率）。
调整关键参数（根据你的硬件和需求）：
- 推理步数（Steps）：一般设置在20-50之间。步数越多，细节可能越丰富，但生成时间也越长。请注意：如果你关闭了FLUX.1-Turbo-Alpha这个LoRA，推理步数至少需要设置为20步，否则图像质量会下降。
- 分辨率（Width/Height）：FLUX.1-dev支持生成较大尺寸的图片（如1024x1024）。如果显存不足，可以适当降低分辨率（如768x768）。
- LoRA权重：如果你加载了LoRA，可以调整其权重值（通常0-1之间），来控制风格影响的强弱。
- 采样器（Sampler）和调度器（Scheduler）：工作流通常已经设置了推荐的组合，如dpmpp_2m采样器，初学者可以不用修改。
点击生成：检查所有设置无误后，点击界面上的“Queue Prompt”或“Run”按钮。ComfyUI会开始处理你的请求。
查看结果：生成过程中，你可以在节点上看到进度。完成后，最终输出的图片会显示在预览节点（通常是Preview Image或Save Image节点）上。第一张图片生成可能会比较慢，因为需要加载模型到显存，后续生成就会快很多。

恭喜你！至此，你已经成功在ComfyUI中部署并运行了Nunchaku FLUX.1-dev模型，生成了属于自己的AI画作。

5. 关键注意事项与排错指南

为了让你获得更顺畅的体验，这里总结几个关键点和常见问题的解决方法：

模型存放目录不能错：这是最常见的问题。请务必确认文件放在了正确的位置：
- FLUX.1-dev主模型 -> models/unet/
- LoRA模型 -> models/loras/
- 文本编码器 -> models/text_encoders/
- VAE模型 -> models/vae/
显存不足怎么办？
- 首先，尝试使用量化版本模型（INT4/FP4/FP8）。
- 其次，在生成时降低输出图片的分辨率。
- 关闭ComfyUI中其他不必要的自定义节点或模型。
工作流加载后节点缺失/报错？
- 这通常是因为缺少某个自定义节点。ComfyUI有一个强大的社区管理器 ComfyUI-Manager。如果你还没安装，建议安装它。通过Manager，你可以轻松搜索并安装缺失的节点。
- 确保你的Nunchaku插件和后端都已正确安装。
图片生成效果不理想？
- 检查推理步数：如果关闭了Turbo LoRA，步数是否低于20？
- 优化提示词：使用更具体、详细的英文描述。可以加入风格词汇（如digital art, photorealistic）、画质词汇（如masterpiece, best quality, 8K）。
- 尝试不同种子（Seed）：有时候换一个随机种子，就能得到截然不同的好结果。
性能与兼容性：
- 完整FP16模型对显存要求较高（约33GB），请根据你的显卡量力而行。
- 确保你的PyTorch和CUDA版本兼容。