如何制作自己的数字人呢?不用担心平台的使用授权,也不用担心哪一天自己自媒体被号被无故封杀,那么SadTalker将是你的首选,他是完全开源的数字人软件,现已达到Apache2的授权,完全自由的开源软件。作者自己试着搭建效果还不错,口形模拟、脖子的扭动、眨眼晴等都非常的自然。

制作方法
1、创建python环境
conda create -n sadtalker python=3.8
如果使用英伟达的GPU,你还需要安装pytorch,版本1.12.1
2、安装视频处理工具
conda install ffmpeg
3、下载sadtalker的原代码:
git clone https://github.com/Winfredy/SadTalker.git将代码完整克隆。
4、进入下载目录,安装相关依赖
pip install -r requirements.txt


5、下载预训练模型
https://github.com/OpenTalker/SadTalker/releases
将下载的模型放在checkpoints文件夹下,如果没这个文件夹就自己建一个。
6、将gfpgan\weights\GFPGANv1.4.pth目下的权重文件考到anaconda3的weights目下。举个例子:
gfpgan\weights\GFPGANv1.4.pth 剪切到虚拟环境的  D:\Anaconda3\envs\sadtalker\Lib\site-packages\gfpgan\weights 这个目录下
7、语音文件放到:sadTalker\examples\driven_audio 目录下。语音文件可以自己录制,如果测试也可以用目下面已经录好的wav文件。
8、找一张个人的正面照片放到:sadTalker\examples\source_image 目录下。

接下来就可以生成数字人了:
python inference.py --driven_audio D:\project\SadTalker\examples\driven_audio\map_chinese.wav --source_image D:\project\SadTalker\examples\source_image\full_body.png --enhancer gfpgan --preprocess full --stil

安装git和anaconda,如果不会安装可以参考我在CSDN上的的相关文档,里面有详细的安装方法。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐