OpenClaw 的 PDF 处理核心是安装对应 Skill + 自然语言指令调用,覆盖合并 / 拆分 / 转格式 / 提取 / OCR / 加密水印等全场景,本地处理、无需上传。


一、核心 PDF 技能(必装)

1. PDF 全能处理(anthropics/pdf)
  • 能力:合并、拆分、旋转、删除页面;提取文本 / 表格 / 图片;PDF↔Word / 图片;添加水印、加密;OCR 扫描件。
  • 安装:openclaw skills install anthropics/pdf 或在 ClawHub 搜索安装。
2. ComPDF Editor(企业级)
  • 能力:精准编辑、表单填写、批量水印、权限控制,支持 Win/Mac 本地处理。
3. PDF 分析工具(原生)
  • 能力:多文件(≤10 个)输入、页面筛选(如 1-5,7)、自定义提示词分析,默认 10MB / 文件、20 页 / 次。

二、依赖安装(首次必备)

bash

运行

pip install pypdf pdfplumber reportlab  # 处理/提取/生成
pip install pdfjs-dist @napi-rs/canvas   # 渲染与OCR依赖

三、常用指令示例(直接对话)

  1. 合并把 1.pdf、2.pdf 合并为 all.pdf
  2. 拆分将 report.pdf 按每5页拆分,保存到 output 文件夹
  3. 提取表格提取 invoice.pdf 第2页表格,转 Excel
  4. OCR 扫描件OCR 识别 scan.pdf,输出可编辑文本
  5. 加密 + 水印给 contract.pdf 添加“机密”水印并设密码 123456

四、高级工作流(学术 / 办公)

  1. 文献整理监控 ~/Downloads,新PDF自动解析→提取标题/作者→按年份分类归档
  2. 合同比对解析 A/B 合同PDF→提取关键条款→生成差异对比表

五、关键注意事项

  • 最大文件:默认 10MB / 个,可在配置调大;单次处理≤20 页。
  • 扫描件:必须用 OCR 技能,纯文本提取无效。
  • 格式错乱:优先用 ComPDF 或 MinerU 解析为 Markdown/JSON 再处理。
Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐