如何制作自己的数字人

如何制作自己的数字人呢？不用担心平台的使用授权，也不用担心哪一天自己自媒体被号被无故封杀，那么SadTalker将是你的首选，他是完全开源的数字人软件，现已达到Apache2的授权，完全自由的开源软件。作者自己试着搭建效果还不错，口形模拟、脖子的扭动、眨眼晴等都非常的自然。

文章共474字 · 阅读需要大约2分钟

一键AI生成摘要，助你高效阅读

问答

BBM的开源HUB

1214人浏览 · 2023-10-23 19:44:25

BBM的开源HUB · 2023-10-23 19:44:25 发布

制作方法
1、创建python环境
conda create -n sadtalker python=3.8
如果使用英伟达的GPU，你还需要安装pytorch,版本1.12.1
2、安装视频处理工具
conda install ffmpeg
3、下载sadtalker的原代码：
git clone https://github.com/Winfredy/SadTalker.git将代码完整克隆。
4、进入下载目录，安装相关依赖
pip install -r requirements.txt

5、下载预训练模型
https://github.com/OpenTalker/SadTalker/releases
将下载的模型放在checkpoints文件夹下，如果没这个文件夹就自己建一个。
6、将gfpgan\weights\GFPGANv1.4.pth目下的权重文件考到anaconda3的weights目下。举个例子：
gfpgan\weights\GFPGANv1.4.pth 剪切到虚拟环境的 D:\Anaconda3\envs\sadtalker\Lib\site-packages\gfpgan\weights 这个目录下
7、语音文件放到：sadTalker\examples\driven_audio 目录下。语音文件可以自己录制，如果测试也可以用目下面已经录好的wav文件。
8、找一张个人的正面照片放到：sadTalker\examples\source_image 目录下。

接下来就可以生成数字人了:
python inference.py --driven_audio D:\project\SadTalker\examples\driven_audio\map_chinese.wav --source_image D:\project\SadTalker\examples\source_image\full_body.png --enhancer gfpgan --preprocess full --stil