logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【ComfyUI】SD1.5 + ControlNet 姿态搭配线稿融合动漫转真人

本文介绍了一套基于ComfyUI的动漫转真人图像风格反推工作流,通过自动化提取动漫人物特征并生成关键词,结合大模型引导生成高真实感人像。核心流程包括图像加载、关键词反推(WD14Tagger模型)、姿态识别(ControlNet)、Prompt编码(CLIPTextEncode)及高清生成(KSampler+IterativeUpscale),支持稳定输出符合现实美学的图像。系统模块化设计涵盖语义

文章图片
#ComfyUI
【ComfyUI】SD1.5 + ControlNet 边缘检测融合动漫转真人

本文介绍了一个基于ComfyUI的动漫转真人图像生成工作流,通过多模型协同实现高质量的二次元图像转换。该工作流集成了Canny线稿预处理、ControlNet结构控制、VAE编码解码和人脸精细化处理等核心环节,采用majicmixRealistic_v7作为主模型,配合yolov8、SAM等辅助模型。整个流程包含11个标准化步骤,从图像输入、预处理到最终超分输出,通过ControlNet引导和CL

文章图片
#ComfyUI
【ComfyUI】HiDream_I1 Fast16步极速文生图

本文展示了一个基于HiDream-I1模型的ComfyUI工作流,通过加载扩散模型、文本编码器与VAE组件,实现了从文本到图像的生成流程。工作流包含模型加载、提示词解析、潜在采样、图像解码等核心环节,支持多种应用场景如艺术创作、概念设计等。文章详细介绍了各节点功能、工作流程及应用价值,并提供了相关开发资源链接。该工作流展现了ComfyUI的模块化优势,为AI图像生成提供了高效可控的解决方案。

文章图片
#ComfyUI
【ComfyUI】Wan2.2 Smooth Mix 通用主题电影质感图生视频

本文介绍了一个基于ComfyUI的电影质感图生视频工作流,适用于短片、微电影等创作场景。该工作流采用双模型融合技术(SmoothMix高低曝光模型),结合BlockSwap机制和SD3采样模块,实现丰富的画面层次与高动态范围效果。核心流程包括模型加载融合、文本/视觉提示处理、潜变量生成解码及视频合成,通过KSamplerAdvanced和CLIPVisionEncode确保帧间连贯性。关键节点如C

文章图片
#ComfyUI
【ComfyUI】SD1.5 + ControlNet 边缘检测搭配深度融合动漫转真人

本文介绍了一个基于ComfyUI的动漫转真人AI工作流,通过双重ControlNet(Canny边缘检测和Depth深度图)实现高度还原的风格转换。该工作流采用majicmixRealistic_v7主模型,配合WD14Tagger自动标签识别和BNK_CLIPTextEncodeAdvanced提示词编码等节点,形成完整的图像处理流程:首先对输入动漫图像进行768x768的尺寸统一,然后分别提取

文章图片
#ComfyUI
【ComfyUI】SD1.5 + ControlNet 边缘检测搭配深度融合动漫转真人

本文介绍了一个基于ComfyUI的动漫转真人AI工作流,通过双重ControlNet(Canny边缘检测和Depth深度图)实现高度还原的风格转换。该工作流采用majicmixRealistic_v7主模型,配合WD14Tagger自动标签识别和BNK_CLIPTextEncodeAdvanced提示词编码等节点,形成完整的图像处理流程:首先对输入动漫图像进行768x768的尺寸统一,然后分别提取

文章图片
#ComfyUI
【ComfyUI】ACE Step 文本驱动 AI 音乐创作

AI音乐创作工作流摘要 本工作流提供了一套完整的文本驱动AI音乐生成方案,通过歌词输入、曲风设定、参数配置和音频输出四个环节,将文字描述转化为原创音乐。核心模型ACEStepGen负责理解歌词内容和风格提示,将其转换为具有旋律、节奏和氛围的音乐音频。工作流采用模块化设计,包含歌词处理、风格转换、参数调节等节点,使创作者仅需输入歌词和风格描述即可快速生成成品音乐。其中ACE-Step Prompt模

文章图片
#ComfyUI
【ComfyUI】Qwen Edit 人像一致性写真修图

本文介绍了一套基于Qwen系列视觉模型的人像一致性写真修图工作流。该工作流通过多模型协同(UNET、CLIP、VAE等)实现从单张人像生成连续动态场景,保持面部特征稳定的同时完成自然过渡。流程包含图像加载、视觉理解、提示词生成、条件编码、采样解码等8个阶段,利用AILab_QwenVL节点自动分析图像并生成连贯场景描述,配合LoRA强化风格表现,最终输出高质量一致性人像写真。整套方案实现了人像编辑

文章图片
#ComfyUI
Tarui工具箱常用API获取

本文介绍了多个AI平台的API Key/Token创建方法。云雾平台需登录控制台创建令牌并选择分组;GrsAI在API Key管理页创建并配置参数;DeepSeek在API keys页面创建Key并命名;RunningHub在个人中心创建共享API KEY;微软Azure TTS需注册Azure后创建Speech资源获取Region和Key。各平台创建后均需立即复制保存Key/Token,初始配置

文章图片
AIGC工具平台-SadTalker音频对口型数字人

SadTalker作为开源数字人生成工具,通过音频驱动实现口型与表情同步,支持虚拟主播、短视频等场景。本文详解其在整合包环境下的使用流程,包括参数配置(如表情幅度、镜头角度)、图像增强选项,并提供典型命令行示例。项目采用脚本操作,需搭配源码文档使用,支持批量处理与高清修复(GFPGAN/RestoreFormer)。文末附Tauri+Django开发框架的AIGC工具平台资源,涵盖环境部署、常见问

文章图片
#AIGC#音视频
    共 94 条
  • 1
  • 2
  • 3
  • 10
  • 请选择