RAG 应用 Skill 技能说明书

数据来源:SkillsBot · RAG应用分类
整理时间:2026-03-16


页面截图

在这里插入图片描述


技能速览表

Skill 名称 功能描述 痛点解决 下载地址
知识库问答系统 基于 RAG 架构的智能研究助手,整合私有论文库与外部知识源,提供准确可追溯的研究问题解答 研究人员难以快速检索海量文献,答案缺乏溯源依据 查看详情
提示词与模式调优 自定义文档分析提取功能,精确控制从学术论文等文档中提取的信息内容和格式 AI 提取信息时字段和格式无法灵活定制,导致输出不符合需求 查看详情
RAGEngineering 完整 RAG 系统 完整的 RAG 系统构建、优化和调试方法论,覆盖架构评估到生产部署全过程 构建 RAG 系统缺乏系统性方法,容易踩坑导致效果差 查看详情
设置管理 Thoth 学术研究助手的配置管理系统,提供 API 密钥管理、文件路径设置、搜索参数调整等功能 学术研究助手各模块配置分散,参数调整繁琐难以统一管理 查看详情
ClawRAG 连接器 自托管、隐私优先的 RAG 引擎,将本地文档转为向量存储,支持混合查询 企业和个人数据不愿上传云端,现有 RAG 方案隐私保护不足 查看详情
Agentuity 云向量搜索工具 在 Agentuity 云平台上执行语义相似性向量搜索的命令行接口 向量搜索缺乏统一的命令行操作入口,不支持灵活过滤条件 查看详情
Agentuity 云向量命名空间列表工具 列出和管理 Agentuity 云平台向量数据库中所有命名空间的 CLI 工具 向量数据库命名空间查询繁琐,缺少便捷的管理工具 查看详情
网页搜索与内容提取 通过 Tavily 和 Exa 等服务提供网页搜索和内容提取,支持 RAG 管道构建 RAG 系统缺少实时网络数据来源,知识库更新滞后 查看详情
Firecrawl 网页爬取技能 将网站内容转换为适合 LLM 的 Markdown 或结构化数据,处理 JS 渲染与反爬虫 现有爬虫无法处理动态 JS 渲染页面,AI 数据采集成本高 查看详情
外部知识管理 组织、存储和检索非研究论文类参考资料的系统工具,支持多格式上传与智能搜索 研究人员背景资料散落各处,难以快速检索和与 RAG 系统集成 查看详情
文档抓取器 自动化抓取在线文档网站并编译为单个 Markdown 文件,为 AI 代理提供上下文数据 手动整理在线文档耗时费力,RAG 上下文数据难以批量准备 查看详情
提示词压缩技能 通过令牌高效压缩、上下文修剪和选择性提取,在保持质量的同时减少令牌消耗 LLM 调用成本高,长提示词导致 Token 浪费且响应变慢 查看详情

技能详细说明

1. 知识库问答系统

项目 内容
Skill ID knowledge-base-qa
评分 ⚡ 4.5
安装量 4+
详情页 https://www.skillsbot.cn/skill/2566

功能描述
基于 RAG(检索增强生成)架构的智能研究助手,能够整合用户私有研究论文库和外部知识源(如教科书、讲义),通过混合检索、查询扩展、文档评分和幻觉检查等技术,提供准确、可追溯的研究问题解答。支持快速问答和深度分析两种模式,具备 CRAG(纠正性检索增强生成)工作流程,当本地知识覆盖不足时自动建议并整合网络搜索结果。

痛点解决

  • 研究人员面对海量文献无法快速定位答案
  • 传统问答系统无法追溯答案来源,可信度低
  • 本地知识库不够时需手动切换网络搜索,流程割裂

适用场景:学术研究、文献综述、技术调研


2. 提示词与模式调优

项目 内容
Skill ID prompt-schema-tuning
评分 ⚡ 4.5
安装量 2+
详情页 https://www.skillsbot.cn/skill/2570

功能描述
用于自定义文档分析提取功能的技能。允许用户通过修改分析模式(定义提取哪些字段)和提示模板(指导 AI 如何提取),精确控制从学术论文等文档中提取的信息内容和格式。

痛点解决

  • AI 提取文档时字段定义不灵活,输出格式难以控制
  • 不同文档类型需要不同的提取策略,通用模板效果差
  • 缺乏面向非技术人员的提示工程调优工具

适用场景:文档分析、学术研究、信息抽取、RAG 应用


3. RAGEngineering — 完整 RAG 系统

项目 内容
Skill ID afrexai-rag-engineering
评分 ⚡ 4.5
安装量 2+
详情页 https://www.skillsbot.cn/skill/773

功能描述
完整的 RAG 系统构建、优化和调试方法论,涵盖从架构评估到数据预处理、从块策略到嵌入策略、再到检索优化和生产部署的全过程,旨在帮助用户构建高效、准确的 RAG 系统。

痛点解决

  • 构建 RAG 系统缺乏系统性方法论,各环节容易踩坑
  • 数据预处理、分块策略等关键决策缺乏最佳实践指导
  • 系统调试困难,效果差时不知从哪里排查

适用场景:RAG 系统工程、AI 应用开发、企业知识库建设


4. 设置管理

项目 内容
Skill ID settings-management
评分 ⚡ 4.5
安装量 2+
详情页 https://www.skillsbot.cn/skill/2574

功能描述
Thoth 学术研究助手的配置管理系统,提供 API 密钥管理、文件路径设置、搜索参数调整、RAG 配置等功能。支持设置查看、更新、验证、重置和迁移,实现集中化配置管理和自动化验证。

痛点解决

  • 学术研究助手各模块配置分散,难以统一管理
  • API 密钥和路径配置修改繁琐,容易出错
  • 缺少配置验证机制,参数错误难以及时发现

适用场景:学术研究工具配置、RAG 参数管理、多环境配置迁移


5. ClawRAG 连接器

项目 内容
Skill ID clawrag
评分 ⚡ 4.5
安装量 1+
详情页 https://www.skillsbot.cn/skill/839

功能描述
自托管、隐私优先的检索增强生成(RAG)引擎,专为 OpenClaw 设计。通过 Docker 部署,将本地文档(PDF、Word、Markdown)转换为向量存储,结合语义搜索与关键词匹配(BM25)进行混合查询,为 AI 应用提供准确、可溯源的答案。核心功能包括文档智能摄取、多知识库管理、MCP 原生集成。

痛点解决

  • 企业和个人敏感数据不愿上传云端,现有云端 RAG 方案隐私风险高
  • 本地部署 RAG 系统复杂,缺少开箱即用的工具
  • 混合检索(语义+关键词)实现门槛高,单一检索方式效果有限

适用场景:企业私有知识库、数据本地化部署、隐私保护 AI 应用


6. Agentuity 云向量搜索工具

项目 内容
Skill ID agentuity-cli-cloud-vector-search
评分 ⚡ 4.5
安装量 0
详情页 https://www.skillsbot.cn/skill/3172

功能描述
用于在 Agentuity 云平台上执行语义相似性向量搜索的命令行接口。允许用户通过自然语言查询,在指定命名空间中查找语义上最接近的向量化数据条目,支持结果数量限制、相似度阈值和元数据过滤。

痛点解决

  • 向量搜索缺乏统一的命令行操作入口,开发者体验差
  • 不支持灵活的过滤条件,搜索结果精度不足
  • RAG 应用开发中向量检索集成复杂

适用场景:AI 应用开发、知识管理、内容检索、RAG 系统构建


7. Agentuity 云向量命名空间列表工具

项目 内容
Skill ID agentuity-cli-cloud-vector-list-namespaces
评分 ⚡ 4.5
安装量 0
详情页 https://www.skillsbot.cn/skill/3100

功能描述
用于 Agentuity 云平台的命令行工具,专门用于列出和管理向量数据库中的所有命名空间。支持快速查询向量命名空间、多种别名调用方式、返回数组格式的结果,适用于向量数据库管理和 RAG 系统维护。

痛点解决

  • 向量数据库命名空间查询繁琐,缺少便捷的管理工具
  • 多命名空间场景下管理混乱,难以快速定位数据
  • 缺少标准化的 CLI 调用方式

适用场景:向量数据库管理、AI 应用开发、RAG 系统维护


8. 网页搜索与内容提取

项目 内容
Skill ID web-search
评分 ⚡ 4.5
安装量 1+
详情页 https://www.skillsbot.cn/skill/8913

功能描述
通过 Tavily 和 Exa 等服务提供网页搜索和内容提取功能,支持 AI 搜索、RAG 应用、事实核查、内容聚合和 AI 智能体开发,适用于研究、RAG 管道、事实核查和内容聚合等场景。

痛点解决

  • RAG 系统仅依赖静态知识库,无法获取实时网络信息
  • 事实核查缺乏可靠的外部信息来源验证
  • 内容聚合需要多平台搜索,流程碎片化

适用场景:RAG 管道、实时研究、事实核查、AI 智能体


9. Firecrawl 网页爬取技能

项目 内容
Skill ID firecrawl-scraper
评分 ⚡ 4.5
安装量 1+
详情页 https://www.skillsbot.cn/skill/6695

功能描述
用于人工智能的网页数据 API 技能,能够将网站内容转换为适合大语言模型(LLM)的 Markdown 或结构化数据。处理 JavaScript 渲染、绕过反爬虫系统、支持格式转换和浏览器自动化,适用于站点提取、动态内容抓取和 AI 数据准备。

痛点解决

  • 传统爬虫无法处理 JS 动态渲染页面,内容获取不完整
  • 反爬虫系统阻止自动化数据采集
  • AI 数据准备需要 Markdown 格式,手动转换效率极低

适用场景:AI 训练数据采集、RAG 知识库构建、网站内容监控


10. 外部知识管理

项目 内容
Skill ID external-knowledge
评分 ⚡ 4.5
安装量 1+
详情页 https://www.skillsbot.cn/skill/2565

功能描述
用于组织、存储和检索非研究论文类参考资料的系统工具,包括教科书、讲义笔记、技术文档和背景材料。通过创建主题知识库、支持多格式文件上传、智能搜索和与研究问答系统集成,帮助研究人员快速获取理论基础和背景知识。

痛点解决

  • 研究人员背景参考资料散落各处,难以统一管理
  • 教科书和讲义无法直接接入 RAG 系统
  • 多格式文件(PDF、Word、Markdown 等)处理繁琐

适用场景:学术研究、知识管理、RAG 知识库建设


11. 文档抓取器

项目 内容
Skill ID documentation-scraper
评分 ⚡ 4.5
安装量 1+
详情页 https://www.skillsbot.cn/skill/7245

功能描述
自动化抓取在线文档网站,并将其编译为单个 Markdown 文件,专为 AI 代理提供上下文数据,支持 RAG 应用。基于 slurp-ai 实现,简化了文档批量获取与整理流程。

痛点解决

  • 手动整理在线文档耗时费力,内容分散在多个页面
  • AI 代理需要完整文档上下文,手动拼接 Markdown 效率极低
  • RAG 知识库的文档数据准备缺乏自动化工具

适用场景:AI 代理上下文准备、RAG 知识库构建、文档自动化整理


12. 提示词压缩技能

项目 内容
Skill ID prompt-compression
评分 ⚡ 4.5
安装量 1+
详情页 https://www.skillsbot.cn/skill/252

功能描述
用于优化大语言模型使用成本的技术技能,通过令牌高效压缩、上下文修剪和选择性提取等方法,在保持提示质量的同时减少令牌消耗。关键技术包括 LLMLingua 压缩、摘要压缩和令牌修剪,适用于成本优化和智能体性能提升场景。

痛点解决

  • LLM 长提示词调用成本高昂,Token 消耗难以控制
  • 上下文过长导致响应速度变慢,影响用户体验
  • 压缩过度会损失关键信息,缺少智能化的平衡机制

适用场景:LLM 成本优化、RAG 上下文管理、智能体 Token 效率提升


技术方向分类

🏗️ RAG 系统构建与工程

技能 特点
RAGEngineering 完整 RAG 系统 完整方法论,从架构到部署
ClawRAG 连接器 自托管,隐私优先,Docker 部署
知识库问答系统 CRAG 工作流,混合检索

📚 知识库与数据准备

技能 特点
外部知识管理 多格式文档,主题知识库
文档抓取器 在线文档批量抓取编译
Firecrawl 网页爬取技能 JS 渲染,反爬虫,结构化输出
网页搜索与内容提取 实时搜索,Tavily/Exa 接口

🔍 向量检索与数据库管理

技能 特点
Agentuity 云向量搜索工具 语义相似性搜索,CLI
Agentuity 云向量命名空间列表工具 命名空间管理,多别名调用

⚙️ 配置与调优

技能 特点
设置管理 集中化配置,自动化验证
提示词与模式调优 字段定义,提示模板自定义
提示词压缩技能 Token 优化,LLMLingua 压缩

本说明书共收录 12 个 RAG 应用技能,数据来源于 SkillsBot 技能库 第一页。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐