logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LTX2.3-EditAnything - 用提示词轻松改视频:加物、删物、换物、换风格 一句话搞定 一键整合包下载

另一种移除不想移除的东西的方法是简单地添加一个遮罩,例如品红色,覆盖你想移除的物体,并使用此视频作为指南。显存8G+运存32G起,如果低于这个配置,建议使用参数更低的模型,比如Q2,Q3,生成效果质量略低。启动后自动跳转WebUI,上传视频,输入提示词,设置生成视频时长和长度等参数,生成即可。进入工作流后,上传视频,输入提示词,设置生成视频时长和长度等参数,最后运行即可。,下载后,放到ComfyU

文章图片
#人工智能
Faster Qwen3-TTS - 实时语音合成加速引擎,实时流式,语音克隆、设计 支持50系显卡 一键整合包下载

Faster Qwen3-TTS 是一个专门为实时语音合成优化的开源工具,它能在普通显卡上实现比原版 Qwen3-TTS 快数倍的推理速度,并支持语音克隆、定制声音和流式生成。提示词可以借助大模型,写出你要表达的情感,比如下面的描述:“体现撒娇稚嫩的萝莉女声,音调偏高且起伏明显,营造出黏人、做作又刻意卖萌的听觉效果”1、语音设计:可以根据文字描述设计声音,比如“温柔女声”“年轻男声”,甚至能创造全

文章图片
#语音识别#人工智能
AdvancedLivePortrait V2版 - 一张照片生成生动任意表情图片/视频,支持50系显卡 本地一键整合包下载

整合一个面部表情编辑与动画生成工具,可以使用一张照片生成各种面部表情动作的表情包图片,还支持一张图加一段参考视频生成视频中的面部表情视频。面部表情精准控制‌:支持对静态照片中的面部表情进行精细编辑,包括点头、摇头、头部旋转、眼睛开合、嘴部动作等,可从示例照片中提取表情并应用到目标图像上 ‌。技术优势‌:采用深度学习算法(如GANs),确保动画流畅自然,硬件要求低,即使CPU也可以运行,但推荐独立显

文章图片
#图像处理
Wan2.2-S2V - 音频驱动图像生成电影级质量的数字人视频 ComfyUI工作流 支持50系显卡 一键整合包下载

Wan2.2-S2V 是阿里云开源的一款多模态视频生成模型,该模型专为音频驱动的电影视频生成而设计,其核心功能是通过一张静态图片和一段音频,自动生成电影级质量的数字人视频。上传图像和音频,调节生成时长(生成下的length,16帧为一秒,比如81帧,即生成5秒长度),输入提示词,最后点下方的运行即可。效果逼真‌:生成视频的口型与音频精准同步,面部表情自然,肢体动作流畅,甚至能模拟弹钢琴时手指的细节

文章图片
#音视频#人工智能
ThinkSound V2版 - 一键给无声视频配音,为AI视频生成匹配音效 支持50系显卡 一键整合包下载

视频生成模型的配音‌:该框架还可以与视频生成模型配合使用,为这些模型生成的视频提供配音。这意味着,在自动生成视频的同时,也能自动生成与之匹配的音频,进一步推动自动化内容创作的边界。虚拟现实与增强现实‌:在虚拟现实(VR)和增强现实(AR)应用中,ThinkSound可以生成与用户的交互行为实时匹配的音频效果,提升沉浸感和真实感。ThinkSound 是阿里通义实验室开源的首个音频生成模型,它能够让

文章图片
#音视频#人工智能
LatentSync V8版 - 音频驱动视频生成数字人说话视频 更新V1.6版模型 支持50系显卡 支持批量 一键整合包下载

比如你给一段配音,它能自动调整视频人物的嘴型,按照配音里的声音说出来,就像真人说话一样自然。简单说就是个让"假人说话像真人"的黑科技,拍视频、做直播的小伙伴用起来特别方便,也可广泛应用于数字人生成领域,自媒体必备神器。解压说明:一键包和模型包分开打包上传,分别下载一键包和模型包,先解压一键包,再下载模型包并复制到一键包目录下,右键->解压到当前文件夹,目录结构参考一键包内文档说明。注意事项:上传参

文章图片
#音视频#人工智能
Wan2GP V2版 - 低配显卡玩转AI视频生成,一个强大的视频生成集成项目 支持50系显卡 一键整合包下载

它支持多种视频生成模型,包括阿里的Wan及其衍生模型、腾讯的Hunyuan Video和LTV Video等,通过简洁易用的网页界面,用户无需深入了解复杂的模型细节,即可轻松生成想要的视频内容。使用和之前发布的Wan2.1以及类似的视频生成软件类似,根据需要,点击最上方的模型列表,切换需要使用的模型,会根据切换的模型自动下载,模型较大,耐心等待下载完成。易用性‌:提供全网页界面,用户无需安装额外软

文章图片
#人工智能#音视频
Wan2GP V11版 - 低配显卡玩转AI视频生成,更新Wan2.2图生视频模型 支持首尾帧生成 支持50系显卡 一键整合包下载

它囊括了多种视频生成模型,包括阿里的Wan及其衍生模型、腾讯的Hunyuan Video和LTV Video等主流视频生成模型,通过简洁易用的网页界面,用户无需深入了解复杂的模型细节,即可轻松生成想要的视频内容。今天分享的 Wan2GP V11版,基于官方7月30日的V7.5打包,更新Wan2.2图生视频模型,支持首尾帧生成视频。使用和之前发布的Wan2.1以及类似的视频生成软件类似,根据需要,点

文章图片
#人工智能#音视频
Wan2.2 - 阿里最新开源视频生成模型 支持文生视频/图生视频 支持50系显卡 一键整合包

个人创作者的“AI工具箱” 短视频/自媒体: 输入文字或图片,一键生成抖音/B站风格的短视频(如旅行Vlog、美食教程),无需拍摄和剪辑。TI2V-5B最低支持8G显存生成(需开启共享显存),I2V-A14B最低支持12G显存生成(需开启共享显存)。产品展示的“动态说明书” 3D商品视频: 生成服装的上身效果、家具的摆放场景,或电子产品的功能演示,提升转化率。Wan2.2 是阿里开源的一款电影级视

文章图片
#人工智能#音视频
Heygem 宇宙最强AI数字人生成软件,自媒体福音,开源免费 免Docker本地一键包下载

前段时间还听说国外的Heygen(一个商业数字人软件,其实就是国人在国外注册的公司)把Heygem告了,由头是Heygem侵权,猜测就是因为Heygem开源了,而且开源的效果媲美Heygen的商业模型,影响Heygen卖钱了(Heygem价格不是一般的贵),这简直是把Heygen整死的节奏啊。当时开源的时候,我就自行摸索按照网上的教程本地搭建Docker,然后一步步搭建完成,但过程太复杂,中间也踩

文章图片
#媒体#人工智能#计算机视觉
    共 103 条
  • 1
  • 2
  • 3
  • 11
  • 请选择