logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 支持数字人 Multitalk +InfiniteTalk +文生视频+图生视频+批量生成+首尾帧

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型(Wan 2.1、Hunyuan Video、LTX Video 等)做了重度优化和封装,让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快,并提供了一整套 Web 界面与周边工具,做到“开箱即玩”。一句话总结:**把原本需要 20-80 GB 显存才能跑的前沿视频模型,压

文章图片
#人工智能#音视频
IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示 v1.5 20250519更新

摘要:IndexTTS是由B站推出的创新中文文本转语音(TTS)模型,通过混合建模和时间戳嵌入技术显著提升了发音准确性(误读率降至0.9%)和自然度(断句准确率98.6%)。其技术架构融合了条件编码器、BigVGAN2解码器和Conformer模型,支持8G显卡运行,操作简便。应用场景广泛,包括无障碍阅读、智能客服和教育等。开源项目已获社区关注,未来将优化情感表达和多语种支持。

文章图片
#人工智能#音视频#AIGC
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 支持数字人 Multitalk +InfiniteTalk +文生视频+图生视频+批量生成+首尾帧

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型(Wan 2.1、Hunyuan Video、LTX Video 等)做了重度优化和封装,让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快,并提供了一整套 Web 界面与周边工具,做到“开箱即玩”。一句话总结:**把原本需要 20-80 GB 显存才能跑的前沿视频模型,压

文章图片
#人工智能#音视频
视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

《AI全自动视频工厂:一键生成高清短视频》摘要: 这是一个开源AI视频生成工具,能将文字描述自动转换为专业短视频。用户只需输入文本(如教程或科普内容),系统就会智能匹配素材库中的高清视频片段,自动完成配音、字幕、配乐和转场特效,输出可直接发布的成品视频。工具特别适合自媒体创作者快速制作内容,支持本地部署(需技术基础)或在线平台简化版使用。部分高级功能需调用国内AI大模型服务,注册即赠试用额度。该项

文章图片
#人工智能#音视频#AIGC
自媒体时代的超级个体!RPA+Coze自动创作和发布小红书爆款笔记

研究了两天终于实现了小红书图文笔记的自动创作和发布,结合RPA+Coze解放你的双手,提升自媒体时代的创造力,后续会不定时给大家带来爆款工作流合集的更新。我是从零开始,不定期分享AI玩法,给大家带来更多工作流玩法。创作不易,如果有收获麻烦一键三连,博主才有更新100个爆款工作流的动力,包括火柴人心理学、炫酷书单、行业自媒体、小人国、电商带货等。本次分享就到这里,有收获的麻烦您一键三连,博主才有更新

文章图片
#rpa#人工智能#AIGC
AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250628更新 支持magcache加速

FramePack一款高效视频生成工具,基于神经网络实现逐帧预测,支持低显存运行(最低6GB)。特点包括:在RTX4090上可达1.5秒/帧的生成速度,支持大批次训练,提供GUI界面和多种注意力机制。

文章图片
#人工智能#音视频#AIGC
手把手教你搭建Coze工作流,一键创作自媒体平台爆火的心理学火柴人视频

极简心理学火柴人视频制作流程解析 摘要:本文拆解了当前流行的极简心理学火柴人视频制作流程。该工作流通过用户输入主题→大模型生成文案→拆分文案→合成音频字幕→生成绘图提示词→制作背景→剪映合成等环节完成视频制作。关键节点包括:1)大模型节点调整提示词可个性化文案;2)语音字幕合成节点选择音色;3)图像生成节点定制火柴人形象;4)剪映插件添加特效。工作流最终生成视频链接,可导入剪映进行二次编辑。该流程

文章图片
#人工智能#AIGC
beterpic 一键修复老照片、智能上色、超清还原,去除水印 ——全能AI图像编辑神器来了!

基于先进的 qwen 图片编辑模型 与 Nunchaku 量化技术 构建,结合 LoRA 微调模型支持,提供强大且高效的图像编辑能力。无论是老照片修复、人像增强、风景优化,还是黑白图上色,都能一键实现高质量输出。

文章图片
#图像处理#人工智能
音视频转字幕小工具V1.2,支持上百种语言,离线视频翻译神器,批量处理,操作极其简单

音视频转字幕小工具V1.2,支持上百种语言,离线视频翻译神器,批量处理,操作极其简单

文章图片
#音视频#人工智能
IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示 v1.5 20250519更新

摘要:IndexTTS是由B站推出的创新中文文本转语音(TTS)模型,通过混合建模和时间戳嵌入技术显著提升了发音准确性(误读率降至0.9%)和自然度(断句准确率98.6%)。其技术架构融合了条件编码器、BigVGAN2解码器和Conformer模型,支持8G显卡运行,操作简便。应用场景广泛,包括无障碍阅读、智能客服和教育等。开源项目已获社区关注,未来将优化情感表达和多语种支持。

文章图片
#人工智能#音视频#AIGC
    共 14 条
  • 1
  • 2
  • 请选择