OpenClaw PDF处理

OpenClaw提供本地化PDF处理解决方案，支持合并/拆分/格式转换/OCR等全场景操作。核心功能包括：基础PDF处理技能（必装）、企业级编辑工具ComPDFEditor和原生分析工具。首次使用需安装Python依赖库。支持常用指令如合并文件、提取表格、OCR识别等，并可通过高级工作流实现文献整理、合同比对等复杂任务。注意事项包括默认10MB/单文件限制、OCR扫描件处理要求，以及推荐使用专业工

eastyuxiao

201人浏览 · 2026-04-29 09:21:56

eastyuxiao · 2026-04-29 09:21:56 发布

OpenClaw 的 PDF 处理核心是安装对应 Skill + 自然语言指令调用，覆盖合并 / 拆分 / 转格式 / 提取 / OCR / 加密水印等全场景，本地处理、无需上传。

一、核心 PDF 技能（必装）

1. PDF 全能处理（anthropics/pdf）

能力：合并、拆分、旋转、删除页面；提取文本 / 表格 / 图片；PDF↔Word / 图片；添加水印、加密；OCR 扫描件。
安装：openclaw skills install anthropics/pdf 或在 ClawHub 搜索安装。

2. ComPDF Editor（企业级）

能力：精准编辑、表单填写、批量水印、权限控制，支持 Win/Mac 本地处理。

3. PDF 分析工具（原生）

能力：多文件（≤10 个）输入、页面筛选（如 1-5,7）、自定义提示词分析，默认 10MB / 文件、20 页 / 次。

二、依赖安装（首次必备）

bash

运行

pip install pypdf pdfplumber reportlab  # 处理/提取/生成
pip install pdfjs-dist @napi-rs/canvas   # 渲染与OCR依赖

三、常用指令示例（直接对话）

合并：把 1.pdf、2.pdf 合并为 all.pdf
拆分：将 report.pdf 按每5页拆分，保存到 output 文件夹
提取表格：提取 invoice.pdf 第2页表格，转 Excel
OCR 扫描件：OCR 识别 scan.pdf，输出可编辑文本
加密 + 水印：给 contract.pdf 添加“机密”水印并设密码 123456

四、高级工作流（学术 / 办公）

文献整理：监控 ~/Downloads，新PDF自动解析→提取标题/作者→按年份分类归档
合同比对：解析 A/B 合同PDF→提取关键条款→生成差异对比表

五、关键注意事项

最大文件：默认 10MB / 个，可在配置调大；单次处理≤20 页。
扫描件：必须用 OCR 技能，纯文本提取无效。
格式错乱：优先用 ComPDF 或 MinerU 解析为 Markdown/JSON 再处理。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

当长期记忆向量库遭遇投毒攻击：如何用相似度阈值与安全分类器构建防御圈

龙虾开发者社区

Agent 网关密钥管理：如何用 ClawBridge 实现多模型路由与动态轮换

龙虾开发者社区

ClawOS immutable根文件系统实战：Agent乱写防护与OOM杀进程策略

龙虾开发者社区

所有评论(0)

查看更多评论

eastyuxiao

@eastyuxiao

已为社区贡献14条内容

OpenClaw PDF处理

eastyuxiao

一、核心 PDF 技能（必装）

1. PDF 全能处理（anthropics/pdf）

2. ComPDF Editor（企业级）

3. PDF 分析工具（原生）

二、依赖安装（首次必备）

三、常用指令示例（直接对话）

四、高级工作流（学术 / 办公）

五、关键注意事项

所有评论(0)

温馨提示：您尚未绑定手机号

eastyuxiao