【人工智能】短视频生成工具MoneyPrinterTurbo安装使用教程
在短视频创作日益普及的当下,手动制作视频不仅耗时,还需掌握剪辑、文案撰写等多种技能。而 MoneyPrinterTurbo 作为一款开源全自动短视频生成工具,只需输入主题或关键词,即可自动完成文案生成、素材匹配、字幕制作、BGM搭配,并合成高清短视频。本文将从项目介绍、特色、部署安装到实际使用,为你提供一份完整教程,帮助你快速上手这款工具。
【精选优质专栏推荐】
- 《AI 技术前沿》 —— 紧跟 AI 最新趋势与应用
- 《网络安全新手快速入门(附漏洞挖掘案例)》 —— 零基础安全入门必看
- 《BurpSuite 入门教程(附实战图文)》 —— 渗透测试必备工具详解
- 《网安渗透工具使用教程(全)》 —— 一站式工具手册
- 《CTF 新手入门实战教程》 —— 从题目讲解到实战技巧
- 《前后端项目开发(新手必知必会)》 —— 实战驱动快速上手
每个专栏均配有案例与图文讲解,循序渐进,适合新手与进阶学习者,欢迎订阅。
前言
在短视频创作日益普及的当下,手动制作视频不仅耗时,还需掌握剪辑、文案撰写等多种技能。而 MoneyPrinterTurbo 作为一款开源全自动短视频生成工具,只需输入主题或关键词,即可自动完成文案生成、素材匹配、字幕制作、BGM搭配,并合成高清短视频。本文将从项目介绍、特色、部署安装到实际使用,为你提供一份完整教程,帮助你快速上手这款工具。
1. 项目介绍
MoneyPrinterTurbo 是 GitHub 上开源的 AI 驱动型短视频生成项目,仓库地址:
https://github.com/harry0703/MoneyPrinterTurbo
其采用 MIT 开源协议,支持通过 Web 界面或 API 调用,实现“关键词→完整短视频”的全流程自动化。
其核心逻辑是:通过大模型(如 GPT、DeepSeek、文心一言等)生成符合主题的文案,从无版权素材库(如 Pexels)匹配高清视频片段,结合 AI 语音合成生成旁白,自动添加可自定义的字幕,并搭配背景音乐,最终合成横屏(16:9)或竖屏(9:16)的高清视频。
此外,项目还提供了便捷的第三方支持:
- 录咖(RecCloud):基于该项目开发的在线 AI 视频生成器(中文版:https://reccloud.cn,英文版:https://reccloud.com),无需本地部署,直接在线使用。
- 佐糖(PicWish):项目赞助方,提供免费图像处理工具(如一键抠图、模糊变清晰),可辅助优化视频素材。
2. 项目特色
MoneyPrinterTurbo 的核心优势在于“全自动化”与“高灵活性”,具体特色如下:
特色分类 | 具体功能描述 |
---|---|
架构与交互 | 采用完整 MVC 架构,代码结构清晰;支持 Web 可视化界面和 API 接口,兼顾易用性与二次开发 |
文案与素材 | - AI 自动生成文案(支持中文/英文),也可手动自定义 - 视频素材来自无版权库,支持本地素材上传 |
视频规格 | - 支持两种高清尺寸:竖屏 9:16(1080x1920)、横屏 16:9(1920x1080) - 可设置视频片段时长,调节素材切换频率 |
批量与选择 | 支持批量生成多个视频,可从结果中选择最满意的版本 |
语音合成 | 支持多种语音类型(含 Azure 高质量语音),可实时试听效果;后期计划支持 GPT-SoVITS 情感配音 |
字幕功能 | - 两种生成方式:edge(速度快,低配置友好)、whisper(质量高,需3GB模型) - 可自定义字幕字体、位置、颜色、大小及描边 |
背景音乐 | 支持随机调用默认 BGM 或指定本地音乐文件,可调节背景音乐音量 |
大模型兼容性 | 支持 OpenAI、Moonshot、DeepSeek、文心一言、Google Gemini 等主流模型,国内用户推荐 DeepSeek/Moonshot(无需 VPN,注册送额度) |
后期计划 | 优化语音自然度、增加视频转场效果、扩展素材来源、支持自动上传 YouTube 等 |
3. 配置要求
在开始部署前,需确保本地环境满足以下最低要求(显卡非必须,CPU/内存足够即可):
- 硬件:CPU 4核及以上,内存 4GB 及以上
- 系统:Windows 10 及以上 / MacOS 11.0 及以上 / Linux(Ubuntu/CentOS 等)
- 网络:需正常联网(国内用户若使用国外模型,需进行额外网络配置;部分资源如 Whisper 模型提供国内下载链接)
4. 部署安装
项目提供 4 种部署方式,覆盖“小白友好型”(一键启动、在线运行)到“技术型”(Docker、手动部署),可根据自身技术水平选择。
4.1 方式1:Google Colab 在线运行(零配置,推荐小白)
无需本地安装任何软件,直接在 Google Colab 中运行,步骤如下:
1.打开项目文档中的 Colab 链接;
2.点击 Colab 页面中的“运行单元格”按钮,等待环境自动配置完成;
3.配置完成后,根据提示访问 Web 界面链接,即可开始使用。
4.注意,此处需修改为真实 token:
4.2 方式2:Windows 一键启动包(本地快速部署)
针对 Windows 用户提供的简化包,无需手动安装依赖,步骤如下:
1.下载启动包:
- 百度网盘(v1.2.6):https://pan.baidu.com/s/1wg0UaIyXpO3SqIpaq790SQ,提取码:sbqx
- Google Drive(v1.2.6):https://drive.google.com/file/d/1HsbzfT7XunkrCrHw5ncUjFX8XX4zAuUh/view?usp=sharing
2.解压与更新:
- 解压压缩包,注意解压路径不能包含中文、空格或特殊字符(如“D:\MoneyPrinterTurbo”为合法路径);
- 双击解压目录中的 update.bat,自动更新到最新代码;
3.启动工具:双击 start.bat,系统会自动打开浏览器(若空白,换 Chrome/Edge 浏览器),进入 Web 界面。
4.3 方式3:Docker 部署(跨系统通用,推荐技术用户)
Docker 部署可避免环境冲突,步骤如下:
1.安装 Docker:
- 下载 Docker Desktop:https://www.docker.com/products/docker-desktop/;
- Windows 用户需先启用 WSL(参考微软文档:WSL 安装、WSL 容器);
2.拉取代码与启动容器:
打开终端(Windows 用 PowerShell,Mac/Linux 用终端),执行以下命令:
#克隆项目代码
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
# 进入项目目录
cd MoneyPrinterTurbo
# 启动 Docker 容器(新版 Docker 用 docker compose,旧版用 docker-compose)
docker compose up
3.访问界面:
- Web 界面:打开浏览器访问
http://0.0.0.0:8501
; - API 文档:访问
http://0.0.0.0:8080/docs
或http://0.0.0.0:8080/redoc
(可在线调试接口)。
4.4 方式4:手动部署(自定义程度高,适合开发者)
手动部署需逐一步骤配置依赖,适合需要自定义功能的用户,步骤如下:
步骤1:克隆项目代码
打开终端,执行:
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
步骤2:创建并激活虚拟环境(推荐用 Conda)
# 安装 Conda(若未安装,参考:https://docs.conda.io/en/latest/miniconda.html)
# 创建虚拟环境(Python 3.11 版本)
conda create -n MoneyPrinterTurbo python=3.11
# 激活虚拟环境
conda activate MoneyPrinterTurbo
# 安装项目依赖
pip install -r requirements.txt
步骤3:安装 ImageMagick(字幕渲染依赖)
ImageMagick 用于字幕生成,不同系统安装方式不同:
- Windows:
- 下载静态库版本:ImageMagick-7.1.1-32-Q16-x64-static.exe;
- 默认路径安装(不要修改路径);
- 打开
config.toml
(需先复制config.example.toml
并重命名为config.toml
),设置imagemagick_path
为安装路径(如C:\\Program Files\\ImageMagick-7.1.1-Q16-HDRI\\magick.exe
)。
- MacOS:执行 brew install imagemagick;
- Ubuntu:执行 sudo apt-get install imagemagick;
- CentOS:执行 sudo yum install ImageMagick。
步骤4:启动 Web 界面或 API 服务
-
启动 Web 界面(可视化操作):
Windows:双击 webui.bat 或终端执行 webui.bat;
Mac/Linux:终端执行 sh webui.sh;
启动后自动打开浏览器,若空白换 Chrome/Edge。 -
启动 API 服务(用于二次开发):
终端执行 python main.py,API 文档访问 http://127.0.0.1:8080/docs。
步骤5:配置模型与 API Key(可选)
若需使用特定大模型(如 DeepSeek、Moonshot),需修改 config.toml:
1.复制 config.example.toml 为 config.toml;
2.配置 pexels_api_keys(Pexels 素材库 API,可在 Pexels 开发者平台 申请);
3.配置 llm_provider(如 llm_provider = “deepseek”),并填写对应模型的 API Key。
5. 使用教程
以 Web 界面为例(最直观,适合大多数用户),讲解完整使用流程。
5.1 步骤1:进入 Web 界面
部署完成后,浏览器会自动打开 Web 界面(或手动访问 http://127.0.0.1:8501/http://0.0.0.0:8501)。
5.2 步骤2:输入视频主题与配置参数
在界面中填写以下核心参数:
-
视频主题/关键词:如“如何增加生活的乐趣”“为什么要运动”,越具体生成效果越好;
-
视频尺寸:选择“竖屏 9:16(1080x1920)”(适合抖音、快手)或“横屏 16:9(1920x1080)”(适合 YouTube、B站);
-
文案设置:
勾选“AI 自动生成文案”:系统基于关键词生成文案;
取消勾选:手动输入自定义文案(支持分段,每段对应一个视频片段); -
语音设置:
选择语音类型(如“Azure-zh-CN-XiaoxiaoNeural”“DeepSeek-Default”),点击“试听”确认效果; -
字幕设置:
选择字幕生成方式(默认“edge”,速度快;若字幕不准确,切换为“whisper”);
自定义字幕样式:字体(如“MicrosoftYaHeiBold.ttc”)、颜色(如白色)、大小、位置(如底部居中)、描边(如黑色描边,增强可读性); -
背景音乐(BGM):
选择“随机默认 BGM”或“指定本地 BGM”(需先将音乐文件放入resource/songs
目录);
调节 BGM 音量(建议 0.3-0.5,避免盖过人声); -
批量生成设置:
若需多版本选择,设置“批量生成数量”(如 3,即生成 3 个不同素材组合的视频)。
5.3 步骤3:启动视频生成
点击界面底部的“开始生成”按钮,系统会进入任务队列,显示“生成中”。
- 生成过程耗时:取决于视频长度(默认短视频约 1-3 分钟)、网络速度(素材下载)和电脑配置;
- 查看进度:界面会实时显示“文案生成→素材匹配→语音合成→字幕生成→视频合成”的进度。
5.4 步骤4:查看与下载视频
- 生成完成后,界面会显示“生成成功”,并列出所有生成的视频预览;
- 点击“预览”可在线播放视频,确认效果;
- 点击“下载”按钮,将视频保存到本地(默认保存路径可在 config.toml 中配置)。
5.5 步骤5:API 调用示例(可选,适合开发者)
若需通过 API 集成到其他系统,以“生成视频”为例:
- 访问 API 文档:http://127.0.0.1:8080/docs;
- 找到 /api/v1/videos 接口,点击“Try it out”;
- 填写请求参数(JSON 格式),示例:
{ "topic": "生命的意义是什么", "video_ratio": "9:16", "auto_script": true, "voice_name": "Azure-zh-CN-XiaoxiaoNeural", "subtitle_provider": "edge", "bgm_name": "default.mp3", "batch_count": 1 }
- 点击“Execute”,获取 task_id;
- 调用 /api/v1/tasks/{task_id} 接口,查询任务状态,生成完成后获取视频下载链接。
6. 常见问题与补充说明
6.1 常见错误解决
问题1:RuntimeError: No ffmpeg exe could be found
原因:ffmpeg(视频合成依赖)未自动下载或未识别;
解决:
- 手动下载 ffmpeg:https://www.gyan.dev/ffmpeg/builds/;
- 解压后找到
ffmpeg.exe
,记录路径(如C:\\ffmpeg\\bin\\ffmpeg.exe
); - 打开
config.toml
,在[app]
下添加:ffmpeg_path = "C:\\ffmpeg\\bin\\ffmpeg.exe"
(Windows 路径分隔符用\\
)。
问题2:ImageMagick 安全策略阻止操作
报错:ImageMagick's security policy 'PDF' blocking operation
;
解决:
- 找到 ImageMagick 的
policy.xml
文件:
Windows:C:\\Program Files\\ImageMagick-7.1.1-Q16-HDRI\\policy.xml
;
Linux:/etc/ImageMagick-6/policy.xml
; - 找到
<policy domain="path" pattern="@" rights="none"/>
,将rights="none"
改为rights="read|write"
; - 保存文件,重启工具。
问题3:OSError: [Errno 24] Too many open files
原因:系统打开文件数限制过低;
解决(Linux/Mac):
- 终端执行
ulimit -n
,查看当前限制(默认可能 256); - 执行
ulimit -n 10240
,临时调高限制(永久生效需修改系统配置文件,如/etc/security/limits.conf
)。
问题4:Whisper 模型下载失败
原因:国内无法访问 Hugging Face,无法下载 3GB 的 whisper-large-v3
模型;
解决:
- 下载国内镜像:
百度网盘:https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA,提取码:xjs9;
夸克网盘:https://pan.quark.cn/s/3ee3d991d64b; - 解压模型文件,将
whisper-large-v3
目录放入MoneyPrinterTurbo/models
下,最终路径为MoneyPrinterTurbo/models/whisper-large-v3
(需包含config.json
、model.bin
等文件)。
6.2 语音合成与字幕生成细节
-
语音列表:所有支持的语音类型可在项目文档“语音合成”部分查看(如 Azure 新增 9 种中文语音,需配置 Azure API Key);
-
字幕切换:在
config.toml
中设置subtitle_provider = "edge"
或subtitle_provider = "whisper"
,留空则不生成字幕。
6.3 背景音乐与字体管理
-
背景音乐:默认 BGM 位于
resource/songs
目录,可自行添加 MP3 格式音乐; -
字幕字体:默认字体位于
resource/fonts
目录,可放入自定义字体文件(如.ttf
.ttc
格式),并在 Web 界面选择。
7. 总结
MoneyPrinterTurbo 是一款“降低短视频创作门槛”的实用工具,其核心优势在于:
1.全自动化:从文案到合成,无需手动操作,节省大量时间;
2.高灵活性:支持多模型、多尺寸、自定义字幕/BGM,满足不同场景需求;
3.低门槛:提供一键启动、在线运行等方式,小白也能快速上手;
4.开源免费:代码开源,支持二次开发,持续更新优化(如后期计划的情感配音、转场效果)。
无论你是自媒体创作者、内容团队,还是需要批量生成短视频的开发者,这款工具都能显著提升创作效率。如果在使用中遇到问题,可通过 GitHub 仓库提交 Issue 反馈,或参与社区讨论。
更多推荐
所有评论(0)