【精选优质专栏推荐】


每个专栏均配有案例与图文讲解,循序渐进,适合新手与进阶学习者,欢迎订阅。

前言

在短视频创作日益普及的当下,手动制作视频不仅耗时,还需掌握剪辑、文案撰写等多种技能。而 MoneyPrinterTurbo 作为一款开源全自动短视频生成工具,只需输入主题或关键词,即可自动完成文案生成、素材匹配、字幕制作、BGM搭配,并合成高清短视频。本文将从项目介绍、特色、部署安装到实际使用,为你提供一份完整教程,帮助你快速上手这款工具。

在这里插入图片描述

1. 项目介绍

MoneyPrinterTurbo 是 GitHub 上开源的 AI 驱动型短视频生成项目,仓库地址:

https://github.com/harry0703/MoneyPrinterTurbo

在这里插入图片描述

其采用 MIT 开源协议,支持通过 Web 界面或 API 调用,实现“关键词→完整短视频”的全流程自动化。

其核心逻辑是:通过大模型(如 GPT、DeepSeek、文心一言等)生成符合主题的文案,从无版权素材库(如 Pexels)匹配高清视频片段,结合 AI 语音合成生成旁白,自动添加可自定义的字幕,并搭配背景音乐,最终合成横屏(16:9)或竖屏(9:16)的高清视频。

此外,项目还提供了便捷的第三方支持:

  • 录咖(RecCloud):基于该项目开发的在线 AI 视频生成器(中文版:https://reccloud.cn,英文版:https://reccloud.com),无需本地部署,直接在线使用。
  • 佐糖(PicWish):项目赞助方,提供免费图像处理工具(如一键抠图、模糊变清晰),可辅助优化视频素材。

2. 项目特色

MoneyPrinterTurbo 的核心优势在于“全自动化”与“高灵活性”,具体特色如下:

特色分类 具体功能描述
架构与交互 采用完整 MVC 架构,代码结构清晰;支持 Web 可视化界面和 API 接口,兼顾易用性与二次开发
文案与素材 - AI 自动生成文案(支持中文/英文),也可手动自定义
- 视频素材来自无版权库,支持本地素材上传
视频规格 - 支持两种高清尺寸:竖屏 9:16(1080x1920)、横屏 16:9(1920x1080)
- 可设置视频片段时长,调节素材切换频率
批量与选择 支持批量生成多个视频,可从结果中选择最满意的版本
语音合成 支持多种语音类型(含 Azure 高质量语音),可实时试听效果;后期计划支持 GPT-SoVITS 情感配音
字幕功能 - 两种生成方式:edge(速度快,低配置友好)、whisper(质量高,需3GB模型)
- 可自定义字幕字体、位置、颜色、大小及描边
背景音乐 支持随机调用默认 BGM 或指定本地音乐文件,可调节背景音乐音量
大模型兼容性 支持 OpenAI、Moonshot、DeepSeek、文心一言、Google Gemini 等主流模型,国内用户推荐 DeepSeek/Moonshot(无需 VPN,注册送额度)
后期计划 优化语音自然度、增加视频转场效果、扩展素材来源、支持自动上传 YouTube 等

3. 配置要求

在开始部署前,需确保本地环境满足以下最低要求(显卡非必须,CPU/内存足够即可):

  • 硬件:CPU 4核及以上,内存 4GB 及以上
  • 系统:Windows 10 及以上 / MacOS 11.0 及以上 / Linux(Ubuntu/CentOS 等)
  • 网络:需正常联网(国内用户若使用国外模型,需进行额外网络配置;部分资源如 Whisper 模型提供国内下载链接)

4. 部署安装

项目提供 4 种部署方式,覆盖“小白友好型”(一键启动、在线运行)到“技术型”(Docker、手动部署),可根据自身技术水平选择。

4.1 方式1:Google Colab 在线运行(零配置,推荐小白)

无需本地安装任何软件,直接在 Google Colab 中运行,步骤如下:

1.打开项目文档中的 Colab 链接;

在这里插入图片描述

2.点击 Colab 页面中的“运行单元格”按钮,等待环境自动配置完成;

在这里插入图片描述

在这里插入图片描述

3.配置完成后,根据提示访问 Web 界面链接,即可开始使用。

4.注意,此处需修改为真实 token:

在这里插入图片描述

4.2 方式2:Windows 一键启动包(本地快速部署)

针对 Windows 用户提供的简化包,无需手动安装依赖,步骤如下:

1.下载启动包:

2.解压与更新:

  • 解压压缩包,注意解压路径不能包含中文、空格或特殊字符(如“D:\MoneyPrinterTurbo”为合法路径);
  • 双击解压目录中的 update.bat,自动更新到最新代码;

3.启动工具:双击 start.bat,系统会自动打开浏览器(若空白,换 Chrome/Edge 浏览器),进入 Web 界面。

4.3 方式3:Docker 部署(跨系统通用,推荐技术用户)

Docker 部署可避免环境冲突,步骤如下:

1.安装 Docker:

2.拉取代码与启动容器:

打开终端(Windows 用 PowerShell,Mac/Linux 用终端),执行以下命令:

#克隆项目代码
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
# 进入项目目录
cd MoneyPrinterTurbo
# 启动 Docker 容器(新版 Docker 用 docker compose,旧版用 docker-compose)
docker compose up

3.访问界面:

  • Web 界面:打开浏览器访问 http://0.0.0.0:8501
  • API 文档:访问 http://0.0.0.0:8080/docshttp://0.0.0.0:8080/redoc(可在线调试接口)。

4.4 方式4:手动部署(自定义程度高,适合开发者)

手动部署需逐一步骤配置依赖,适合需要自定义功能的用户,步骤如下:

步骤1:克隆项目代码

打开终端,执行:

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
步骤2:创建并激活虚拟环境(推荐用 Conda)
# 安装 Conda(若未安装,参考:https://docs.conda.io/en/latest/miniconda.html)
# 创建虚拟环境(Python 3.11 版本)
conda create -n MoneyPrinterTurbo python=3.11
# 激活虚拟环境
conda activate MoneyPrinterTurbo
# 安装项目依赖
pip install -r requirements.txt
步骤3:安装 ImageMagick(字幕渲染依赖)

ImageMagick 用于字幕生成,不同系统安装方式不同:

  • Windows
    1. 下载静态库版本:ImageMagick-7.1.1-32-Q16-x64-static.exe
    2. 默认路径安装(不要修改路径);
    3. 打开 config.toml(需先复制 config.example.toml 并重命名为 config.toml),设置 imagemagick_path 为安装路径(如 C:\\Program Files\\ImageMagick-7.1.1-Q16-HDRI\\magick.exe)。
  • MacOS:执行 brew install imagemagick;
  • Ubuntu:执行 sudo apt-get install imagemagick;
  • CentOS:执行 sudo yum install ImageMagick。
步骤4:启动 Web 界面或 API 服务
  • 启动 Web 界面(可视化操作):
    Windows:双击 webui.bat 或终端执行 webui.bat;
    Mac/Linux:终端执行 sh webui.sh;
    启动后自动打开浏览器,若空白换 Chrome/Edge。

  • 启动 API 服务(用于二次开发):
    终端执行 python main.py,API 文档访问 http://127.0.0.1:8080/docs。

在这里插入图片描述

步骤5:配置模型与 API Key(可选)

若需使用特定大模型(如 DeepSeek、Moonshot),需修改 config.toml:

1.复制 config.example.toml 为 config.toml;

2.配置 pexels_api_keys(Pexels 素材库 API,可在 Pexels 开发者平台 申请);

3.配置 llm_provider(如 llm_provider = “deepseek”),并填写对应模型的 API Key。

5. 使用教程

Web 界面为例(最直观,适合大多数用户),讲解完整使用流程。

5.1 步骤1:进入 Web 界面

部署完成后,浏览器会自动打开 Web 界面(或手动访问 http://127.0.0.1:8501/http://0.0.0.0:8501)。

5.2 步骤2:输入视频主题与配置参数

在界面中填写以下核心参数:

  1. 视频主题/关键词:如“如何增加生活的乐趣”“为什么要运动”,越具体生成效果越好;

  2. 视频尺寸:选择“竖屏 9:16(1080x1920)”(适合抖音、快手)或“横屏 16:9(1920x1080)”(适合 YouTube、B站);

  3. 文案设置
    勾选“AI 自动生成文案”:系统基于关键词生成文案;
    取消勾选:手动输入自定义文案(支持分段,每段对应一个视频片段);

  4. 语音设置
    选择语音类型(如“Azure-zh-CN-XiaoxiaoNeural”“DeepSeek-Default”),点击“试听”确认效果;

  5. 字幕设置
    选择字幕生成方式(默认“edge”,速度快;若字幕不准确,切换为“whisper”);
    自定义字幕样式:字体(如“MicrosoftYaHeiBold.ttc”)、颜色(如白色)、大小、位置(如底部居中)、描边(如黑色描边,增强可读性);

  6. 背景音乐(BGM)
    选择“随机默认 BGM”或“指定本地 BGM”(需先将音乐文件放入 resource/songs 目录);
    调节 BGM 音量(建议 0.3-0.5,避免盖过人声);

  7. 批量生成设置
    若需多版本选择,设置“批量生成数量”(如 3,即生成 3 个不同素材组合的视频)。

5.3 步骤3:启动视频生成

点击界面底部的“开始生成”按钮,系统会进入任务队列,显示“生成中”。

  • 生成过程耗时:取决于视频长度(默认短视频约 1-3 分钟)、网络速度(素材下载)和电脑配置;
  • 查看进度:界面会实时显示“文案生成→素材匹配→语音合成→字幕生成→视频合成”的进度。

5.4 步骤4:查看与下载视频

  1. 生成完成后,界面会显示“生成成功”,并列出所有生成的视频预览;
  2. 点击“预览”可在线播放视频,确认效果;
  3. 点击“下载”按钮,将视频保存到本地(默认保存路径可在 config.toml 中配置)。

5.5 步骤5:API 调用示例(可选,适合开发者)

若需通过 API 集成到其他系统,以“生成视频”为例:

  1. 访问 API 文档:http://127.0.0.1:8080/docs;
  2. 找到 /api/v1/videos 接口,点击“Try it out”;
  3. 填写请求参数(JSON 格式),示例:
    {
      "topic": "生命的意义是什么",
      "video_ratio": "9:16",
      "auto_script": true,
      "voice_name": "Azure-zh-CN-XiaoxiaoNeural",
      "subtitle_provider": "edge",
      "bgm_name": "default.mp3",
      "batch_count": 1
    }
    
  4. 点击“Execute”,获取 task_id;
  5. 调用 /api/v1/tasks/{task_id} 接口,查询任务状态,生成完成后获取视频下载链接。

6. 常见问题与补充说明

6.1 常见错误解决

问题1:RuntimeError: No ffmpeg exe could be found

原因:ffmpeg(视频合成依赖)未自动下载或未识别;

解决:

  1. 手动下载 ffmpeg:https://www.gyan.dev/ffmpeg/builds/
  2. 解压后找到 ffmpeg.exe,记录路径(如 C:\\ffmpeg\\bin\\ffmpeg.exe);
  3. 打开 config.toml,在 [app] 下添加:ffmpeg_path = "C:\\ffmpeg\\bin\\ffmpeg.exe"(Windows 路径分隔符用 \\)。
问题2:ImageMagick 安全策略阻止操作

报错:ImageMagick's security policy 'PDF' blocking operation

解决:

  1. 找到 ImageMagick 的 policy.xml 文件:
    Windows:C:\\Program Files\\ImageMagick-7.1.1-Q16-HDRI\\policy.xml
    Linux:/etc/ImageMagick-6/policy.xml
  2. 找到 <policy domain="path" pattern="@" rights="none"/>,将 rights="none" 改为 rights="read|write"
  3. 保存文件,重启工具。
问题3:OSError: [Errno 24] Too many open files

原因:系统打开文件数限制过低;

解决(Linux/Mac):

  1. 终端执行 ulimit -n,查看当前限制(默认可能 256);
  2. 执行 ulimit -n 10240,临时调高限制(永久生效需修改系统配置文件,如 /etc/security/limits.conf)。
问题4:Whisper 模型下载失败

原因:国内无法访问 Hugging Face,无法下载 3GB 的 whisper-large-v3 模型;

解决:

  1. 下载国内镜像:
    百度网盘:https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA,提取码:xjs9;
    夸克网盘:https://pan.quark.cn/s/3ee3d991d64b
  2. 解压模型文件,将 whisper-large-v3 目录放入 MoneyPrinterTurbo/models 下,最终路径为 MoneyPrinterTurbo/models/whisper-large-v3(需包含 config.jsonmodel.bin 等文件)。

6.2 语音合成与字幕生成细节

  • 语音列表:所有支持的语音类型可在项目文档“语音合成”部分查看(如 Azure 新增 9 种中文语音,需配置 Azure API Key);

  • 字幕切换:在 config.toml 中设置 subtitle_provider = "edge"subtitle_provider = "whisper",留空则不生成字幕。

6.3 背景音乐与字体管理

  • 背景音乐:默认 BGM 位于 resource/songs 目录,可自行添加 MP3 格式音乐;

  • 字幕字体:默认字体位于 resource/fonts 目录,可放入自定义字体文件(如 .ttf .ttc 格式),并在 Web 界面选择。

7. 总结

MoneyPrinterTurbo 是一款“降低短视频创作门槛”的实用工具,其核心优势在于:

1.全自动化:从文案到合成,无需手动操作,节省大量时间;
2.高灵活性:支持多模型、多尺寸、自定义字幕/BGM,满足不同场景需求;
3.低门槛:提供一键启动、在线运行等方式,小白也能快速上手;
4.开源免费:代码开源,支持二次开发,持续更新优化(如后期计划的情感配音、转场效果)。

无论你是自媒体创作者、内容团队,还是需要批量生成短视频的开发者,这款工具都能显著提升创作效率。如果在使用中遇到问题,可通过 GitHub 仓库提交 Issue 反馈,或参与社区讨论。

Logo

更多推荐