
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
ComfyUI适合专业用户,可自由定制节点,功能更丰富,操作更自由。关于Rank,比如模型文件名开头的“svdq-int4_r128”,这里的 r就是rank的缩写,请根据自己的需求选择 (32=快速, 128=平衡, 256=最佳质量-仅INT4),数值越大,推理速度越慢,生成效果越好。模型使用的也是Nunchaku最新开源的 4-bit Z-Image-Turbo,兼容原版lora,集速度和生

MOSS-TTSD(文本到语音对话)支持中英文的双语语音对话合成,能够将两个说话者之间的对话脚本转化为自然、富有表现力的会话式语音。通俗的讲,只需要上传两段参考音频,输入两个人的对话文字内容,即可一键生成两人的对话音频内容,生成对话语音自然、且富有表现力,几乎接近真人对话水平。MOSS-TTSD 是一种语音对话生成模型,能够支持中英文的富有表现力的对话语音合成,支持零样本多说话人语音克隆、语音事件

整合一个面部表情编辑与动画生成工具,可以使用一张照片生成各种面部表情动作的表情包图片,还支持一张图加一段参考视频生成视频中的面部表情视频。面部表情精准控制:支持对静态照片中的面部表情进行精细编辑,包括点头、摇头、头部旋转、眼睛开合、嘴部动作等,可从示例照片中提取表情并应用到目标图像上 。技术优势:采用深度学习算法(如GANs),确保动画流畅自然,硬件要求低,即使CPU也可以运行,但推荐独立显

它以515M的参数规模,展现出令人惊叹的音频生成能力,能够在短短3.7秒内生成高达30秒的高质量音频,展现出卓越的性能和效率。该模型不仅能够生成各种音效,如鸟鸣和口哨声,还引入了一种新的优化框架CLAP-Ranked Preference Optimization(CRPO),以提升生成音频的质量和对齐性能。1、影视与游戏音频制作:TangoFlux可依剧本或场景描述,快速生成逼真音效、配乐及配音

OpenAudio S1 是Fish Audio 近日正式推出其的最新一代语音生成模型,以其高度自然的声音、丰富的语气控制和强大的指令跟随能力,号称达到专业配音演员的表现力和自然度。多语言支持: 得益于200万小时的音频训练数据,OpenAudio S1在语音生成的质量和多样性上取得了显著突破,覆盖英语、中文、日语、韩语、法语、德语、阿拉伯语、西班牙语等13种语言,展现了强大的多语言能力。强大的指

Stand-In 是一个轻量级、即插即用的身份保护视频生成框架,只需要上传一张人物照片,加上一段提示词,即可生成高度一致性的高保真人物视频,人脸相似度和自然都几乎达到100%还原水平。Stand-In 能把任何一张人脸(甚至动漫角色、宠物)无缝“贴”到 AI 生成的视频里,只要你有一张图、一句话,Stand-In 就能把它变成会动的、长得像的视频。Stand-In 支持保持身份的文本到视频生成,非

CosyVoice 3 是阿里巴巴团队推出的一款新一代语音合成模型,它能在没有额外训练的情况下,用多种语言和方言生成自然、富有情感的语音,声音效果接近真人。CosyVoice 3 只需3秒录音,就能让你的声音无缝切换语种、方言与情绪——中、粤、日、英、开心、愤怒......9 种通用语言、18种方言,通通搞定!自然语言控制:上传参考音频,输入需要合成的文字内容,支持喜怒哀乐等多种情感控制,支持十几

SongGeneration 就像是一个智能的音乐创作助手,它能够根据用户提供的歌词、音乐风格描述或者参考音频片段,自动生成完整的歌曲,包括人声和伴奏。,显著提升了音质表现,生成歌曲的准确度相较部分商业闭源模型表现出相当甚至更优的质量,同时在整体表现、旋律、伴奏、音质与结构等维度也优于现有多数同类模型。SongGeneration 是腾讯 AI Lab开源的音乐生成大模型,只需要输入歌词,选择生成

2. 抗漂移采样:告别“视频越生成越歪” 长视频生成最头疼的问题——生成到第10帧还正常,第50帧就“画风突变”,这是传统“单向依赖最后一帧”的缺陷。FramePack用“双向记忆法”解决:生成当前帧时,既参考最近帧的细节,又回溯首帧的核心特征,像“跟着导航走”一样始终紧扣初始设定。今天分享的 FramePack V4版,在上个版本“多行提示词”的基础上,新增时间戳提示词功能,即支持指定秒数提示词

GLM-TTS 测试下来,相比同类文本转语音系统,除了克隆音色相似度更高外,在情感表达和自然度方便也更好,还有就是长文本生成更稳定,且速度快,生成的音频质量也更高。GLM-TTS 是智谱AI开源的一个新型的文本转语音(TTS)系统,它能在“零样本”条件下模仿声音,在极少的语音样本模仿声音,生成自然、有情绪的语音,并且让合成语音更有情感和表现力。右侧加载音色,选择音色,输入需要生成的文字内容,生成即








