【人工智能】短视频生成工具MoneyPrinterTurbo安装使用教程

在短视频创作日益普及的当下，手动制作视频不仅耗时，还需掌握剪辑、文案撰写等多种技能。而 MoneyPrinterTurbo 作为一款开源全自动短视频生成工具，只需输入主题或关键词，即可自动完成文案生成、素材匹配、字幕制作、BGM搭配，并合成高清短视频。本文将从项目介绍、特色、部署安装到实际使用，为你提供一份完整教程，帮助你快速上手这款工具。

秋说

881人浏览 · 2025-10-01 15:18:48

秋说 · 2025-10-01 15:18:48 发布

【精选优质专栏推荐】

《AI 技术前沿》 —— 紧跟 AI 最新趋势与应用

《网络安全新手快速入门(附漏洞挖掘案例)》 —— 零基础安全入门必看

《BurpSuite 入门教程(附实战图文)》 —— 渗透测试必备工具详解

《网安渗透工具使用教程(全)》 —— 一站式工具手册

《CTF 新手入门实战教程》 —— 从题目讲解到实战技巧

《前后端项目开发(新手必知必会)》 —— 实战驱动快速上手

每个专栏均配有案例与图文讲解，循序渐进，适合新手与进阶学习者，欢迎订阅。

文章目录

前言

在短视频创作日益普及的当下，手动制作视频不仅耗时，还需掌握剪辑、文案撰写等多种技能。而 MoneyPrinterTurbo 作为一款开源全自动短视频生成工具，只需输入主题或关键词，即可自动完成文案生成、素材匹配、字幕制作、BGM搭配，并合成高清短视频。本文将从项目介绍、特色、部署安装到实际使用，为你提供一份完整教程，帮助你快速上手这款工具。

在这里插入图片描述

1. 项目介绍

MoneyPrinterTurbo 是 GitHub 上开源的 AI 驱动型短视频生成项目，仓库地址：

https://github.com/harry0703/MoneyPrinterTurbo

在这里插入图片描述

其采用 MIT 开源协议，支持通过 Web 界面或 API 调用，实现“关键词→完整短视频”的全流程自动化。

其核心逻辑是：通过大模型（如 GPT、DeepSeek、文心一言等）生成符合主题的文案，从无版权素材库（如 Pexels）匹配高清视频片段，结合 AI 语音合成生成旁白，自动添加可自定义的字幕，并搭配背景音乐，最终合成横屏（16:9）或竖屏（9:16）的高清视频。

此外，项目还提供了便捷的第三方支持：

录咖（RecCloud）：基于该项目开发的在线 AI 视频生成器（中文版：https://reccloud.cn，英文版：https://reccloud.com），无需本地部署，直接在线使用。
佐糖（PicWish）：项目赞助方，提供免费图像处理工具（如一键抠图、模糊变清晰），可辅助优化视频素材。

2. 项目特色

MoneyPrinterTurbo 的核心优势在于“全自动化”与“高灵活性”，具体特色如下：

特色分类	具体功能描述
架构与交互	采用完整 MVC 架构，代码结构清晰；支持 Web 可视化界面和 API 接口，兼顾易用性与二次开发
文案与素材	- AI 自动生成文案（支持中文/英文），也可手动自定义 - 视频素材来自无版权库，支持本地素材上传
视频规格	- 支持两种高清尺寸：竖屏 9:16（1080x1920）、横屏 16:9（1920x1080） - 可设置视频片段时长，调节素材切换频率
批量与选择	支持批量生成多个视频，可从结果中选择最满意的版本
语音合成	支持多种语音类型（含 Azure 高质量语音），可实时试听效果；后期计划支持 GPT-SoVITS 情感配音
字幕功能	- 两种生成方式：edge（速度快，低配置友好）、whisper（质量高，需3GB模型） - 可自定义字幕字体、位置、颜色、大小及描边
背景音乐	支持随机调用默认 BGM 或指定本地音乐文件，可调节背景音乐音量
大模型兼容性	支持 OpenAI、Moonshot、DeepSeek、文心一言、Google Gemini 等主流模型，国内用户推荐 DeepSeek/Moonshot（无需 VPN，注册送额度）
后期计划	优化语音自然度、增加视频转场效果、扩展素材来源、支持自动上传 YouTube 等

3. 配置要求

在开始部署前，需确保本地环境满足以下最低要求（显卡非必须，CPU/内存足够即可）：

硬件：CPU 4核及以上，内存 4GB 及以上
系统：Windows 10 及以上 / MacOS 11.0 及以上 / Linux（Ubuntu/CentOS 等）
网络：需正常联网（国内用户若使用国外模型，需进行额外网络配置；部分资源如 Whisper 模型提供国内下载链接）

4. 部署安装

项目提供 4 种部署方式，覆盖“小白友好型”（一键启动、在线运行）到“技术型”（Docker、手动部署），可根据自身技术水平选择。

4.1 方式1：Google Colab 在线运行（零配置，推荐小白）

无需本地安装任何软件，直接在 Google Colab 中运行，步骤如下：

1.打开项目文档中的 Colab 链接；

在这里插入图片描述

2.点击 Colab 页面中的“运行单元格”按钮，等待环境自动配置完成；

在这里插入图片描述

3.配置完成后，根据提示访问 Web 界面链接，即可开始使用。

4.注意，此处需修改为真实 token：

在这里插入图片描述

4.2 方式2：Windows 一键启动包（本地快速部署）

针对 Windows 用户提供的简化包，无需手动安装依赖，步骤如下：

1.下载启动包：

百度网盘（v1.2.6）：https://pan.baidu.com/s/1wg0UaIyXpO3SqIpaq790SQ，提取码：sbqx
Google Drive（v1.2.6）：https://drive.google.com/file/d/1HsbzfT7XunkrCrHw5ncUjFX8XX4zAuUh/view?usp=sharing

2.解压与更新：

解压压缩包，注意解压路径不能包含中文、空格或特殊字符（如“D:\MoneyPrinterTurbo”为合法路径）；
双击解压目录中的 update.bat，自动更新到最新代码；

3.启动工具：双击 start.bat，系统会自动打开浏览器（若空白，换 Chrome/Edge 浏览器），进入 Web 界面。

4.3 方式3：Docker 部署（跨系统通用，推荐技术用户）

Docker 部署可避免环境冲突，步骤如下：

1.安装 Docker：

下载 Docker Desktop：https://www.docker.com/products/docker-desktop/；
Windows 用户需先启用 WSL（参考微软文档：WSL 安装、WSL 容器）；

2.拉取代码与启动容器：

打开终端（Windows 用 PowerShell，Mac/Linux 用终端），执行以下命令：

#克隆项目代码
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
# 进入项目目录
cd MoneyPrinterTurbo
# 启动 Docker 容器（新版 Docker 用 docker compose，旧版用 docker-compose）
docker compose up

3.访问界面：

Web 界面：打开浏览器访问 http://0.0.0.0:8501；
API 文档：访问 http://0.0.0.0:8080/docs 或 http://0.0.0.0:8080/redoc（可在线调试接口）。

4.4 方式4：手动部署（自定义程度高，适合开发者）

手动部署需逐一步骤配置依赖，适合需要自定义功能的用户，步骤如下：

步骤1：克隆项目代码

打开终端，执行：

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo

步骤2：创建并激活虚拟环境（推荐用 Conda）

# 安装 Conda（若未安装，参考：https://docs.conda.io/en/latest/miniconda.html）
# 创建虚拟环境（Python 3.11 版本）
conda create -n MoneyPrinterTurbo python=3.11
# 激活虚拟环境
conda activate MoneyPrinterTurbo
# 安装项目依赖
pip install -r requirements.txt

步骤3：安装 ImageMagick（字幕渲染依赖）

ImageMagick 用于字幕生成，不同系统安装方式不同：

Windows：
1. 下载静态库版本：ImageMagick-7.1.1-32-Q16-x64-static.exe；
2. 默认路径安装（不要修改路径）；
3. 打开 config.toml（需先复制 config.example.toml 并重命名为 config.toml），设置 imagemagick_path 为安装路径（如 C:\\Program Files\\ImageMagick-7.1.1-Q16-HDRI\\magick.exe）。
MacOS：执行 brew install imagemagick；
Ubuntu：执行 sudo apt-get install imagemagick；
CentOS：执行 sudo yum install ImageMagick。

步骤4：启动 Web 界面或 API 服务

启动 Web 界面（可视化操作）：
Windows：双击 webui.bat 或终端执行 webui.bat；
Mac/Linux：终端执行 sh webui.sh；
启动后自动打开浏览器，若空白换 Chrome/Edge。
启动 API 服务（用于二次开发）：
终端执行 python main.py，API 文档访问 http://127.0.0.1:8080/docs。

在这里插入图片描述

步骤5：配置模型与 API Key（可选）

若需使用特定大模型（如 DeepSeek、Moonshot），需修改 config.toml：

1.复制 config.example.toml 为 config.toml；

2.配置 pexels_api_keys（Pexels 素材库 API，可在 Pexels 开发者平台申请）；

3.配置 llm_provider（如 llm_provider = “deepseek”），并填写对应模型的 API Key。

5. 使用教程

以 Web 界面为例（最直观，适合大多数用户），讲解完整使用流程。

5.1 步骤1：进入 Web 界面

部署完成后，浏览器会自动打开 Web 界面（或手动访问 http://127.0.0.1:8501/http://0.0.0.0:8501）。

5.2 步骤2：输入视频主题与配置参数

在界面中填写以下核心参数：

视频主题/关键词：如“如何增加生活的乐趣”“为什么要运动”，越具体生成效果越好；
视频尺寸：选择“竖屏 9:16（1080x1920）”（适合抖音、快手）或“横屏 16:9（1920x1080）”（适合 YouTube、B站）；
文案设置：
勾选“AI 自动生成文案”：系统基于关键词生成文案；
取消勾选：手动输入自定义文案（支持分段，每段对应一个视频片段）；
语音设置：
选择语音类型（如“Azure-zh-CN-XiaoxiaoNeural”“DeepSeek-Default”），点击“试听”确认效果；
字幕设置：
选择字幕生成方式（默认“edge”，速度快；若字幕不准确，切换为“whisper”）；
自定义字幕样式：字体（如“MicrosoftYaHeiBold.ttc”）、颜色（如白色）、大小、位置（如底部居中）、描边（如黑色描边，增强可读性）；
背景音乐（BGM）：
选择“随机默认 BGM”或“指定本地 BGM”（需先将音乐文件放入 resource/songs 目录）；
调节 BGM 音量（建议 0.3-0.5，避免盖过人声）；
批量生成设置：
若需多版本选择，设置“批量生成数量”（如 3，即生成 3 个不同素材组合的视频）。

5.3 步骤3：启动视频生成

点击界面底部的“开始生成”按钮，系统会进入任务队列，显示“生成中”。

生成过程耗时：取决于视频长度（默认短视频约 1-3 分钟）、网络速度（素材下载）和电脑配置；
查看进度：界面会实时显示“文案生成→素材匹配→语音合成→字幕生成→视频合成”的进度。

5.4 步骤4：查看与下载视频

生成完成后，界面会显示“生成成功”，并列出所有生成的视频预览；
点击“预览”可在线播放视频，确认效果；
点击“下载”按钮，将视频保存到本地（默认保存路径可在 config.toml 中配置）。

5.5 步骤5：API 调用示例（可选，适合开发者）

若需通过 API 集成到其他系统，以“生成视频”为例：

访问 API 文档：http://127.0.0.1:8080/docs；
找到 /api/v1/videos 接口，点击“Try it out”；

填写请求参数（JSON 格式），示例：

{
  "topic": "生命的意义是什么",
  "video_ratio": "9:16",
  "auto_script": true,
  "voice_name": "Azure-zh-CN-XiaoxiaoNeural",
  "subtitle_provider": "edge",
  "bgm_name": "default.mp3",
  "batch_count": 1
}

点击“Execute”，获取 task_id；
调用 /api/v1/tasks/{task_id} 接口，查询任务状态，生成完成后获取视频下载链接。

6. 常见问题与补充说明

6.1 常见错误解决

问题1：RuntimeError: No ffmpeg exe could be found

原因：ffmpeg（视频合成依赖）未自动下载或未识别；

解决：

手动下载 ffmpeg：https://www.gyan.dev/ffmpeg/builds/；
解压后找到 ffmpeg.exe，记录路径（如 C:\\ffmpeg\\bin\\ffmpeg.exe）；
打开 config.toml，在 [app] 下添加：ffmpeg_path = "C:\\ffmpeg\\bin\\ffmpeg.exe"（Windows 路径分隔符用 \\）。

问题2：ImageMagick 安全策略阻止操作

报错：ImageMagick's security policy 'PDF' blocking operation；

解决：

找到 ImageMagick 的 policy.xml 文件：
Windows：C:\\Program Files\\ImageMagick-7.1.1-Q16-HDRI\\policy.xml；
Linux：/etc/ImageMagick-6/policy.xml；
找到 <policy domain="path" pattern="@" rights="none"/>，将 rights="none" 改为 rights="read|write"；
保存文件，重启工具。

问题3：OSError: [Errno 24] Too many open files

原因：系统打开文件数限制过低；

解决（Linux/Mac）：

终端执行 ulimit -n，查看当前限制（默认可能 256）；
执行 ulimit -n 10240，临时调高限制（永久生效需修改系统配置文件，如 /etc/security/limits.conf）。

问题4：Whisper 模型下载失败

原因：国内无法访问 Hugging Face，无法下载 3GB 的 whisper-large-v3 模型；

解决：

下载国内镜像：
百度网盘：https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA，提取码：xjs9；
夸克网盘：https://pan.quark.cn/s/3ee3d991d64b；
解压模型文件，将 whisper-large-v3 目录放入 MoneyPrinterTurbo/models 下，最终路径为 MoneyPrinterTurbo/models/whisper-large-v3（需包含 config.json、model.bin 等文件）。

6.2 语音合成与字幕生成细节

语音列表：所有支持的语音类型可在项目文档“语音合成”部分查看（如 Azure 新增 9 种中文语音，需配置 Azure API Key）；
字幕切换：在 config.toml 中设置 subtitle_provider = "edge" 或 subtitle_provider = "whisper"，留空则不生成字幕。

6.3 背景音乐与字体管理

背景音乐：默认 BGM 位于 resource/songs 目录，可自行添加 MP3 格式音乐；
字幕字体：默认字体位于 resource/fonts 目录，可放入自定义字体文件（如 .ttf .ttc 格式），并在 Web 界面选择。

7. 总结

MoneyPrinterTurbo 是一款“降低短视频创作门槛”的实用工具，其核心优势在于：

1.全自动化：从文案到合成，无需手动操作，节省大量时间；
2.高灵活性：支持多模型、多尺寸、自定义字幕/BGM，满足不同场景需求；
3.低门槛：提供一键启动、在线运行等方式，小白也能快速上手；
4.开源免费：代码开源，支持二次开发，持续更新优化（如后期计划的情感配音、转场效果）。

无论你是自媒体创作者、内容团队，还是需要批量生成短视频的开发者，这款工具都能显著提升创作效率。如果在使用中遇到问题，可通过 GitHub 仓库提交 Issue 反馈，或参与社区讨论。

北京朝阳AI社区

更多推荐

深度学习前沿技术全景解析 —— 设计思想、源码剖析与业务落地

迁移学习与预训练模型通过知识迁移，大幅提升新任务表现。生成对抗网络实现高质量数据生成，激发创新应用。强化学习智能体自适应环境，推动自动决策技术落地。大模型与多模态学习突破单一信息壁垒，赋能复杂场景理解与生成。迁移换头，冻结微调；真假对抗，交替优化；Q表迭代，奖励驱动；编码融合，智能生成。善用预训练，巧用Prompt，关注资源优化，监控训练曲线。结合主流框架、部署工具，实现模型高效落地。未来趋势：更

北京朝阳AI社区

基于全阿里RAG技术栈，实现企业内部PDF格式规章制度内容的查询

本文介绍了一个基于阿里云技术栈的企业规章制度查询系统实现方案。系统采用PyPDF2提取PDF文档内容并进行切分，使用阿里云text-embedding-v1工具生成文本向量，通过Chroma_DB向量数据库存储和检索文档。系统核心功能包括：PDF内容提取与分段、远程Embedding处理、向量数据库存储、相似内容检索，以及调用Qwen-max大模型生成回答。该方案实现了对企业规章制度的智能问答功能