Wav2Lip

还有一个关于此的教程视频，由 What Make Art 提供。此外，多亏了 Eyal Gruss，Google Colab notebook 更易于使用，具有更多有用的功能。音频源可以是 FFMPEG 支持的任何包含音频数据的文件：*.wav、*.mp3 甚至是视频文件，代码会自动从中提取音频。或者，此处提供了使用 docker 镜像的说明。🔥 🔥 发布了几个新的、可靠的评估基准和指标 [评

AI生成式技术前沿

3491人浏览 · 2023-05-29 06:49:01

AI生成式技术前沿 · 2023-05-29 06:49:01 发布

自述文件中更新了视觉质量光盘的权重！
以高精度将视频口型同步到任何目标语音 💯。试试我们的交互式演示。
✨ 适用于任何身份、声音和语言。也适用于 CGI 面孔和合成声音。
提供完整的训练代码、推理代码和预训练模型💥
或者，使用 Google Colab Notebook 快速入门：链接。检查点和示例也可在 Google Drive 文件夹中找到。还有一个关于此的教程视频，由 What Make Art 提供。此外，多亏了 Eyal Gruss，Google Colab notebook 更易于使用，具有更多有用的功能。此链接提供了教程协作笔记本。
🔥 🔥 发布了几个新的、可靠的评估基准和指标 [评估/此 repo 的文件夹]。还提供了计算论文中报告的指标的说明。
免责声明

先决条件
Python 3.6
ffmpeg: sudo apt-get 安装 ffmpeg
使用 pip install -r requirements.txt 安装必要的包。或者，此处提供了使用 docker 镜像的说明。如果您遇到任何问题，请查看此评论并评论要点。
人脸检测预训练模型下载到face_detection/detection/sfd/s3fd.pth。如果上述方法不起作用，请使用替代链接。
获取权重
模型描述模型链接
Wav2Lip高精度口型同步链接
Wav2Lip + GANS 口型同步稍差，但视觉质量更好Link
Expert Discriminator专家鉴别器的权重Link
Visual Quality Discriminator 在 GAN setupLink 中训练的视觉光盘的权重
使用预训练模型对口型视频（推理）
您可以将任何视频口型同步到任何音频：

python inference.py --checkpoint_path ckpt --face video.mp4 --audio an-audio-source
结果保存（默认）在 results/result_voice.mp4 中。您可以将其指定为参数，类似于其他几个可用选项。音频源可以是 FFMPEG 支持的任何包含音频数据的文件：*.wav、*.mp3 甚至是视频文件，代码会自动从中提取音频。

获得更好结果的提示：

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...