为音视频自动生成字幕的 python 工具

autosub 是一个能自动为音视频生成字幕的 pytho 包,以下为其简介和使用说明。

autosub

autosub 原本使用 python 2.X 开发,仅支持 linux 和 macos 系统,现已停止维护

其原理是对音视频文件进行语音活动检测以查找说话的区域,然后并行调用 Google Web Speech API 进行转录,(可选)翻译成目标语言,并将结果存储下来。

autosub3

基于 autosub,升级到 python 3.X 版本,并添加了对 windows 系统的支持。

安装

依赖 ffmpeg 进行音频提取,需要自己手动安装,并添加到系统环境变量中。

autosub3 的安装非常简单,执行以下命令即可:

pip install autosub3

注意
由于要调用 google speech 的 API,请自行翻墙。

使用

autosub abc.mp4

即可在 abc.mp4 同目录下生成 abc.srt 的字幕文件。

autosub --help

可以查看参数说明

Logo

更多推荐