cover

【MacOS】openai 语音识别模型 whisper 本地部署教程（cpu+mps方案）

一些艰辛的解决报错历程目前macOS+whisper+mps的文章好像比较少发一个分享一下如果有帮到大家请多多点赞～

ranzi-yi

2676人浏览 · 2024-02-27 17:17:47

ranzi-yi · 2024-02-27 17:17:47 发布

目录

1. whisper 安装

参考视频链接与安装过程

安装Python （不要超过3.10）

可能报错问题

2. 无法使用mac gpu 👉 使用whisper.cpp

可能报错问题

3. 生成翻译字幕

系统环境：M1pro macOS 13.6

1. whisper 安装

openai-whisper

以下的语言全部支持识别，数字越小的识别越准确

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Recognition via Large-Scale Weak Supervision - openai/whisperhttps://github.com/openai/whisper

参考视频链接与安装过程

MACOS本地部署whisper ai, 一键生成中英文视频字幕_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1GL411m7mv/?vd_source=c73b771a66067f7c5859120eb61e27aa

安装homebrew

Homebrewhttps://brew.sh/
安装Python （不要超过3.10）
安装Pytorch

在官网按照以下方式选择以后，在终端输入下面的命令安装pytorchvvhttps://pytorch.org/get-started/locally/https://pytorch.org/get-started/locally/https://pytorch.org/get-started/locally/
安装ffmpeg
```
brew install ffmpeg
```
安装rust
```
pip install rust
```
安装whisper
```
pip install -U openai-whisper
```

注意事项

python版本不要超过3.10
在Jupyter notebook使用最好使用 homebrew 安装 ffmpeg

可能报错问题

homebrew安装报错 👉 使用命令2安装

2. 无法使用mac gpu 👉 使用whisper.cpp

GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++Port of OpenAI's Whisper model in C/C++. Contribute to ggerganov/whisper.cpp development by creating an account on GitHub.https://github.com/ggerganov/whisper.cpp 前面的whisper.ai我自己测试下来只能用cpu跑，命令行加上--device mps会报错，大家可以试一下，如果没问题的话可以继续用whisper.ai。

github上很多也反馈存在上述问题，无法使用mps。用cpu的处理速度比较慢，下面用whisper.cpp解决这个问题。测试下来速度有明显提升，大约3min可以用medium模型处理15min的日语视频。

操作步骤

1. 安装whisper.cpp

git clone <https://github.com/ggerganov/whisper.cpp.git>

2. 打开网站，下载模型和对应.mlmodelc，放入whisper.cpp/model 文件夹中

ggerganov/whisper.cpp at mainhttps://huggingface.co/ggerganov/whisper.cpp/tree/main
3. 把文件转换成wav文件（视频文件需要先事先提取音频）
```
ffmpeg -i ./xxxx.mp3 -ar 16000 -ac 1 -c:a pcm_s16le ./xxxx.wav
```

4. 输入命令，并生成srt文件

./main -m models/ggml-medium.bin -f samples/xxxx.wav -l ja -osrt

可能报错问题

输入指令后一直卡死，把下面的进程kill掉

3. 生成翻译字幕

1. 生成英文字幕

./main -m models/ggml-medium.bin -f samples/test1.wav -l ja -osrt -tr

2. 翻译成中文字幕

神经网络实用工具（整活）系列---使用OpenAI的翻译模型whisper实现语音（中、日、英等等）转中字，从此生肉变熟肉---基础篇_whisper模型翻译成中文-CSDN博客https://blog.csdn.net/weixinhum/article/details/130998668
- Google翻译方案成功，但是准确率一般

云原生开发者技术专区邀请您加入

一起探索未来云端世界的核心，云原生技术专区带您领略创新、高效和可扩展的云计算解决方案，引领您在数字化时代的成功之路。

更多推荐

cover

OpenAI突然宣布停止向中国提供API服务！套壳站不禁用国内IP访问，OpenAI将封禁API Key？意料之中还是意外之外？

云原生技术专区

cover

2024最新免费版轻量级Navicat Premium Lite 下载和安装教程

云原生技术专区

cover

ChatGPT的Mac客户端正式发布了！Mac用户有福了

云原生技术专区

所有评论(0)

查看更多评论

ranzi-yi

@weixin_47662299

已为社区贡献1条内容