告别熬夜做PPT!一键生成毕业答辩PPT的AI Skill全解析

毕业季又到了,还在为答辩PPT熬夜?本文介绍一个基于AI Agent的自动化PPT生成Skill,输入论文docx,自动输出排版精美、逻辑清晰的答辩PPT。附完整实现原理、核心代码和使用指南。


一、背景:答辩PPT为什么这么痛苦?

每到毕业季,无数毕业生面临同一个噩梦——做答辩PPT。

问题不在于"不会做",而在于:

  • 从零排版太耗时:调字体、对齐、配色、行距……动辄3-5小时
  • 内容提取靠人工:从几十页论文中摘关键句,反复删改
  • 格式规范难统一:一级标题多大?行距多少?导师要求各不相同
  • 版本迭代崩溃:导师一句"结构调整",整个PPT重排

有没有一种方式,把论文docx直接丢进去,答辩PPT自动出来?

这就是本文要介绍的 thesis-defense-ppt Skill。
Gitee
Github

二、它能做什么?

一句话概括:上传毕业论文docx → 自动生成排版精美的答辩PPT

核心能力

能力 说明
论文解析 自动识别章节结构、提取标题层级
内容精炼 从每节提取3-6条核心论点,去冗余
图片提取 docx中图表自动复制到PPT对应位置
学术排版 藏蓝配色、微软雅黑、标题统一左上角
行距自适应 ≤6条→1.5倍行距,≥7条→自动单倍行距
页码控制 15-20页为主,不超过30页
关键词高亮 核心术语自动加粗,重要数据红色标注

PPT结构(5部分标准答辩框架)

封面(1页)
  └─ 论文题目、学校、答辩人、导师、日期

汇报提纲(1页)
  └─ 5部分竖排编号导航

第1部分:研究背景与意义(2-3页)
  ├─ 研究背景(社会/技术/学术背景)
  ├─ 国内外研究现状(文献要点罗列)
  └─ 现有研究不足 + 本文切入点

第2部分:研究方法与论文结构(2-3页)
  ├─ 核心理论基础(卡片式排列)
  └─ 论文结构图(一级标题 + 箭头连接)

第3部分:研究内容(核心,8-12页)
  ├─ 按二/三级标题逐节展开
  ├─ 每节1-2页,问题→方法→结果
  └─ 论文图片自动嵌入 + 文字说明

第4部分:结论与展望(2-3页)
  ├─ 核心结论(数字编号)
  ├─ 创新点 + 不足与展望
  └─ 致谢页

总计:15-20页(必要时≤30页)

三、效果展示

以下是使用真实论文生成的两份答辩PPT效果:

案例1:xxxx流程优化研究

属性
论文篇幅 35页,约5万字
PPT页数 19页
章节数 5章
生成耗时 <10秒

页面示例
在这里插入图片描述

  • 封面:藏蓝色顶部装饰条 + 白色背景,题目36pt加粗,信息栏清晰排列
  • 汇报提纲:5个编号方块竖排,每项配标题,蓝色连接线贯穿
  • 研究背景:5条要点左侧排列,右侧"核心问题"高亮卡片
  • 核心理论:三项理论左侧竖线 + 标题 + 描述,各占一行
  • 流程优化:横向5步流程图
  • 致谢:大标题居中,简洁感恩文字

案例2:xxxx投资价值研究

属性
论文篇幅 约5万字
PPT页数 18页
章节数 5章
生成耗时 <10秒

特色页面
在这里插入图片描述

  • 方法体系:三卡片 + 底部加权公式条(收益法50% + 市场法25% + 成本法25%)
  • 差异分析:三条红色竖线引导的因果分析卡片
  • 综合评估:五维度星级评分表(财务健康度/运营效率/市场地位/估值空间/风险因素)

四、技术架构

整体流程

论文.docx
   │
   ▼
┌─────────────┐
│ 1. 文本提取  │  python -m markitdown / catdoc
│    图片提取  │  zipfile解压 → word/media/
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 2. 结构分析  │  识别章节标题、层级、关键论点
│    内容提炼  │  每节提取3-6条核心语句
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 3. 页面规划  │  按5部分映射 → 15-20页布局
│    图文匹配  │  图片归属章节 → 插入对应幻灯片
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 4. PptxGenJS │  程序化构建每页幻灯片
│    脚本生成  │  配色/字体/行距/阴影统一应用
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 5. QA检查    │  markitdown文本QA → 无占位符残留
│    交付      │  保存桌面.pptx
└─────────────┘

技术选型

组件 技术 选型理由
PPT生成引擎 PptxGenJS Node.js生态,程序化控制每个像素,支持图表/表格/图片/阴影
图标库 react-icons + sharp SVG→PNG无损渲染,数千图标任意颜色尺寸
文本提取 catdoc / markitdown 命令行直出,无需Python依赖
图片提取 zipfile docx本质是zip,直接解压取media目录
QA验证 markitdown 反向提取PPT文字,检查内容完整性

核心代码架构

// 每页幻灯片的标准构建模式
function makeSlide(title, subtitle, bulletPoints, imagePath) {
  const slide = pres.addSlide();
  
  // 1. 顶部藏蓝装饰线
  topBar(slide);
  
  // 2. 一级标题(左上,24pt,藏蓝,加粗)
  sectionTitle(slide, title);
  
  // 3. 二级标题(16pt,深蓝,加粗)
  if (subtitle) subTitle(slide, subtitle);
  
  // 4. 正文要点(11pt,1.5x行距,≥7条自动切1x)
  bulletList(slide, bulletPoints);
  
  // 5. 图片(如有,保持比例缩放 + 下方说明文字)
  if (imagePath) addImageWithCaption(slide, imagePath);
  
  // 6. 页码(右下,8pt,浅灰)
  pageNumber(slide);
}

五、配色与排版规范

配色方案:藏蓝学术风

用途 色值 色块
主色(标题/装饰/封面) #1B2A4A ██████ 藏蓝
辅助色(二级标题/卡片底) #2D4A7A ██████ 深蓝
浅蓝背景(卡片/区块) #E8EDF5 ██████ 冰蓝
强调色(关键词/数据) #C0392B ██████ 暗红
正文 #333333 ██████ 深灰
页码/注释 #888888 ██████ 浅灰

设计理念:藏蓝传递学术严谨感,白色大面积留白保持清爽,暗红仅用于关键数据标注避免视觉疲劳。

字体规范

元素 字体 字号 样式
封面标题 微软雅黑 36pt 加粗
一级标题 微软雅黑 24pt 加粗,左上角
二级标题 微软雅黑 16pt 加粗,左上角
正文要点 微软雅黑 11pt 常规,关键词加粗
图片说明 微软雅黑 9pt 居中,浅灰
页码 微软雅黑 8pt 右下角

行距规则(关键!)

// 智能行距切换
const lineSpacing = points.length <= 6 ? 33 : 22;
// ≤6条 → 1.5倍行距(舒适阅读)
// ≥7条 → 1.0倍行距(防止溢出页面)

六、如何使用

方式一:通过Hermes Agent使用(推荐)

用户:把这个论文做成答辩PPT
      D:\论文\毕业论文.doc
      
Agent:收到,开始解析...
      ✅ 已生成19页答辩PPT,保存在桌面

Agent 自动完成:解析论文 → 规划结构 → 提取关键内容 → 生成PPT → QA检查 → 交付。

方式二:直接运行脚本

# 1. 安装依赖
npm install pptxgenjs

# 2. 修改 generate_template.js 中的论文信息
#    - THESIS 对象:题目、学校、导师等
#    - SLIDES 数组:每页的内容要点

# 3. 运行
node scripts/generate_template.js

# 输出:答辩PPT_模板输出.pptx

七、设计细节与踩坑经验

1. 旧版 .doc 格式的挑战

很多学校论文仍是 .doc 格式(Word 97-2003),而非 .docx。解决方案:

# catdoc 提取文本(指定UTF-8编码避免中文乱码)
catdoc -d utf-8 paper.doc > thesis.txt

# .doc 的图片提取较困难,可尝试:
# 用 Word 另存为 .docx → zipfile 解压取 media/

2. Zotero引用清理

论文中大量 ADDIN ZOTERO_ITEM JSON块会污染提取文本:

import re
text = re.sub(r'ADDIN ZOTERO_ITEM.*?\}\s*\}', '', text, flags=re.DOTALL)

3. PptxGenJS常见坑

  • 颜色不加 # 前缀color: "1B2A4A"(✅),color: "#1B2A4A"(❌ 文件损坏)
  • 复用选项对象会损坏:每次调用创建新对象
  • breakLine: true 必须:多行文本数组的每一项都需要

4. 页码控制的智慧

15-20页的核心技巧是"要点粒度控制":

  • 每页3-5个要点,每条1-2行
  • 论文不是复述,而是提炼
  • 二级标题多的章节,每标题只需1页
  • 图表优先展示,文字精简

八、局限与未来方向

当前局限

局限 说明
.doc图片提取 旧版.doc格式图片提取不稳定
公式渲染 LaTeX/MathType公式需手动截图放入
模板固定 当前仅一套藏蓝配色,不支持自定义模板
图表数据 论文中表格需手动转为PPT图表格式

未来规划

  • 支持用户自定义PPT模板
  • 接入LLM做内容摘要精炼
  • 自动将论文表格转为PPT数据图表
  • 支持多套配色方案切换
  • 导出PDF带演讲备注

九、总结

thesis-defense-ppt Skill 将答辩PPT制作从"手工精排3小时"变成了"传论文→10秒出稿"。

核心价值:

  1. 全自动化:论文docx → 结构分析 → 内容提取 → PPT生成,一条龙
  2. 学术规范:藏蓝配色 + 微软雅黑 + 标准答辩框架,符合大多数高校要求
  3. 可定制:通过修改 generate_template.js 中的内容数组即可适配任意论文
  4. 可复用:Skill 文件可直接导入 Hermes Agent,后续论文一键生成

毕业季,把时间留给更有价值的事情,让AI帮你搞定PPT。



Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐