被向量检索坑惨了？这个rag-skill能让你告别幻觉，精准检索！

拥抱AGI

46人浏览 · 2026-06-29 15:52:34

拥抱AGI · 2026-06-29 15:52:34 发布

文章探讨了传统 RAG 在知识库问答系统中的局限性，如语义切割失真、检索僵化等，并介绍了由 ConardLi 开源的 rag-skill 解决方案。该方案通过模拟研究员行为，实现多轮迭代检索、分层索引和渐进式披露，有效提升检索精准度和可解释性。rag-skill 特别适用于中小型专业知识库，能处理多种文件格式，并提供手把手安装教程，是传统 RAG 的有力补充。

被向量检索毒打过的人，才会真正理解这个东西的价值。

一、先聊聊你被传统 RAG 坑过没有

做过知识库问答系统的人，大概都有过这样的崩溃时刻——

你辛辛苦苦把几百份文档切成几千个 Chunk，跑 Embedding 向量化，存进 Milvus 或者 Chroma，以为大功告成。结果一上线，用户问了一个稍微绕一点的问题，AI 给出的答案要么文不对题，要么把不相关的段落硬凑在一起，要么直接幻觉。

问题出在哪？

出在"Chunk + Embedding"这个模式的根本局限上：

• 语义切割失真：一个段落强行被截断，上下文完全丢失，向量表示也就失真了
• 检索即终局：检索一次不行就没有第二次，不会回头反思
• 静态流水线：不管问题简单还是复杂，一套流程走到底，没有自适应能力
• 长上下文淹没：一口气把所有 Chunk 都塞给 LLM，重要信息被稀释

就是这个背景下，一个新思路开始在 AI 圈流行起来：用 Agent Skills 做知识库检索。

二、什么是 rag-skill？来自 code秘密花园的开源方案

rag-skill 是由知名 AI 博主 ConardLi（code秘密花园）开源的一个 Agent Skill，专门用于本地知识库检索。

项目地址：https://github.com/ConardLi/rag-skill

它的核心思想颠覆了传统 RAG 的逻辑：

不再"切片-向量化-检索一步到位"，而是让 AI 像一个有经验的研究员一样，先看目录，再按需深入，不满意就迭代，直到找到真正有价值的信息。

这个 Skill 的核心特性如下：

特性	说明
多格式支持	Markdown、PDF、Excel 等多种文件格式
分层索引	通过 `data_structure.md` 实现智能目录导航
渐进式检索	避免全文加载，按需局部读取，节省 token
强制学习机制	处理 PDF/Excel 前必须先学习处理方法
多轮迭代	最多 5 轮智能检索，确保找到最相关信息

三、它和传统 RAG 到底有什么本质区别？

用一个比喻就能说清楚：

传统 RAG 像是开卷考试的学生——随机翻到哪页抄哪页，翻不到就开始编。

rag-skill 像是一个专业研究员——先看目录，制定检索计划，用不同策略找信息，找不够就换关键词反复搜，收集到足够证据才开始回答。

从技术层面看，区别在这几个地方：

1. 从"一次检索"到"多轮迭代"

rag-skill 内置了最多 5 轮的智能检索机制。第一轮找不准？换个关键词、换个思路再来一轮，直到找到足够相关的内容。这就是为什么它在复杂问题上显著优于传统 RAG。

2. 从"全文加载"到"渐进式披露"

传统 RAG 的索引是平铺的，找到 Chunk 就全部丢给 LLM。rag-skill 则通过分层索引（先读目录，再读章节摘要，再读具体段落），大幅减少了无效 token 的消耗。

3. 从"静态流水线"到"动态认知循环"

rag-skill 的检索行为由 LLM 驱动，能根据上一轮检索结果动态调整下一轮策略。这是从"脚本"到"智能体"的本质升级。

四、文件结构长什么样？

在使用之前，先搞清楚 rag-skill 的目录结构：

skilltest/├── .agent/│   └── skills/│       ├── rag-skill/               # 核心知识库检索 Skill│       │   ├── SKILL.md             # Skill 主文件（约13KB）│       │   └── references/          # 参考文档│       │       ├── pdf_reading.md   # PDF 处理方法指南│       │       ├── excel_reading.md # Excel 读取方法│       │       └── excel_analysis.md # Excel 分析方法│       └── skill-creator/           # Skill 创建指南（可选）│└── knowledge/                       # 你的知识库目录    ├── data_structure.md            # 根目录索引（关键！）    ├── AI Knowledge/    │   ├── data_structure.md        # 子目录索引    │   └── *.pdf                    # 具体文档    └── ...

关键点：data_structure.md 是整个系统的导航地图。 每一层目录下都应该有一个这样的索引文件，告诉 Agent 这个目录里有什么内容、用来解决什么问题。没有它，rag-skill 就失去了"先看目录"的能力，退化成普通搜索。

五、手把手使用教程

方式一：通过 npx skills CLI 安装（推荐）

这是最快的方式，一行命令搞定：

# 安装 rag-skill（最新版）npx skills add ConardLi/rag-skill# 或者通过 garden-skills 集合安装npx skills add ConardLi/garden-skills -s kb-retriever# 指定安装到 Claude Codenpx skills add ConardLi/garden-skills -s kb-retriever -a claude-code# 全局安装（适用于所有项目）npx skills add ConardLi/garden-skills -s kb-retriever --global

安装完成后，Skill 会自动放到 .claude/skills/ 或 .agent/skills/ 目录下。

方式二：手动克隆安装

# 克隆仓库git clone https://github.com/ConardLi/rag-skill.git# 将 rag-skill 目录复制到你的项目cp -r rag-skill/.agent/skills/rag-skill  你的项目/.agent/skills/

Step 1：准备你的知识库

这是最关键的一步，也是最容易被忽视的一步。

1.1 创建知识库目录

mkdir -p knowledge/产品文档mkdir -p knowledge/技术规范mkdir -p knowledge/FAQ

1.2 编写根目录 data_structure.md（核心！）

# 知识库结构索引## 目录概览本知识库包含以下主要分类：### 产品文档 (`/knowledge/产品文档/`)- 产品功能说明、使用手册、版本更新记录- 适用场景：用户咨询产品功能、操作步骤### 技术规范 (`/knowledge/技术规范/`)- API 接口文档、架构设计、部署指南- 适用场景：开发人员查阅技术细节### FAQ (`/knowledge/FAQ/`)- 常见问题汇总、故障排查指南- 适用场景：快速定位已知问题的解决方案

1.3 每个子目录也需要 data_structure.md

# 产品文档目录## 文件列表- `产品手册_v2.3.md` - 完整产品功能说明，覆盖所有核心模块- `快速开始指南.md` - 新用户入门，10分钟上手教程- `更新日志.md` - 各版本功能变更记录

Step 2：放入你的文档

支持的格式：

• Markdown（.md）：直接放，效果最好
• PDF：放入对应目录，Skill 会自动学习 PDF 处理方法再读取
• Excel（.xlsx）：同上，有专门的处理流程

最佳实践：Markdown 格式效果最优，建议把 PDF 文档用工具提前转换为 Markdown，再放入知识库。

Step 3：启动 Claude Code 并激活 Skill

在你的项目目录下启动 Claude Code：

claude

Skill 会自动被 Claude Code 检测到。你可以直接开始提问：

用户：我们的 API 限流策略是什么？超出限制后怎么处理？Claude（启用 rag-skill）：[检索第1轮] 读取根目录 data_structure.md，定位到"技术规范"目录[检索第2轮] 读取技术规范/data_structure.md，找到 API 文档[检索第3轮] 局部读取 API接口文档.md 的限流相关章节[生成答案] 基于检索到的内容，结合上下文给出准确回答

Step 4：针对 PDF 和 Excel 的特殊处理

rag-skill 内置了"强制学习机制"：

• 遇到 PDF 文件，Agent 会先读取 references/pdf_reading.md，学习正确的 PDF 处理方法，再去提取内容
• 遇到 Excel 文件，同样先读 excel_reading.md 和 excel_analysis.md

这个机制避免了直接粗暴地 cat 二进制文件导致的乱码或错误。

六、实际效果对比

以下是同一个问题在传统 RAG 和 rag-skill 下的对比（基于实测反馈整理）：

测试问题： “我们的退款政策在哪些情况下不适用？有没有例外条款？”

传统 RAG 表现：

• 返回 3 个相关度 70% 左右的 Chunk
• 答案拼凑感强，遗漏了"例外条款"部分
• 没有说明信息来源

rag-skill 表现：

• 第 1 轮：定位到"用户协议"目录
• 第 2 轮：在退款政策文档中找到主要条款
• 第 3 轮：发现"附录"中存在例外说明，主动深入检索
• 最终答案：完整覆盖主要条款和例外情形，附注具体文档位置

七、常见问题和注意事项

Q1：知识库太大，检索变慢怎么办？

rag-skill 的渐进式检索本身就是为大型知识库设计的，它不会一次性加载所有内容。关键是要做好 分层索引：根目录 → 子目录 → 文件，每层都有清晰的 data_structure.md，这样前两轮检索消耗极少，缩小范围后再深入。

Q2：`data_structure.md` 怎么写才够好？

几个原则：

• 用问题驱动描述，而不是单纯罗列文件名（"用户咨询退款流程时查这里"比"退款.md"更有价值）
• 说明每个文件/目录的适用场景
• 保持及时更新，新增文档后同步更新索引

Q3：适合什么规模的知识库？

根据社区实测，rag-skill 在中小型知识库（文档数量在几十到几百篇）上效果最为突出。大型知识库（上万篇）建议结合传统向量检索做粗筛，再用 rag-skill 做精检。

Q4：和 RAGFlow、Dify 这些产品有什么区别？

RAGFlow、Dify 是完整的 RAG 平台产品，有 UI 界面、用户管理等功能，部署成本高。rag-skill 是一个轻量级的 Agent Skill，直接在 Claude Code 等 Agent 框架下使用，零额外部署，适合开发者在自己的项目中快速集成。

Q5：一定要用 Claude Code 吗？

不是。rag-skill 遵循标准的 Skill 规范，理论上可以在支持 Skills 的 Agent 框架中使用，包括 Cursor、Codex 等。但目前在 Claude Code 上的适配最为成熟。

Q6：PDF 处理效果怎么样？

扫描版 PDF（纯图片）效果较差，建议提前 OCR 转文字。文字型 PDF 效果良好，rag-skill 的强制学习机制确保了正确的提取流程。

最后

我在一线科技企业深耕十二载，见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包：

✅AI大模型学习路线图
✅Agent行业报告
✅100集大模型视频教程
✅大模型书籍PDF
✅DeepSeek教程
✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

在这里插入图片描述

为什么说现在普通人就业/升职加薪的首选是AI大模型？

人工智能技术的爆发式增长，正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议，到全国两会关于AI产业发展的政策聚焦，再到招聘会上排起的长队，AI的热度已从技术领域渗透到就业市场的每一个角落。

智联招聘的最新数据给出了最直观的印证：2025年2月，AI领域求职人数同比增幅突破200% ，远超其他行业平均水平；整个人工智能行业的求职增速达到33.4%，位居各行业榜首，其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张，也让人才供需矛盾愈发突出。麦肯锡报告明确预测，到2030年中国AI专业人才需求将达600万人，人才缺口可能高达400万人，这一缺口不仅存在于核心技术领域，更蔓延至产业应用的各个环节。

在这里插入图片描述

资料包有什么？

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

② AI大模型学习路线图（还有视频解说）

全过程AI大模型学习路线

在这里插入图片描述

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

在这里插入图片描述

④各大厂大模型面试题目详解

在这里插入图片描述

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制，且资料与智泊AI共享，相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌，通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌，构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论，还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

在这里插入图片描述

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

在这里插入图片描述

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

【实测】基于 K100-AI 部署 Hermes Agent 跑自主智能体操作指南

本次测试目标是在海光 DCU K100-AI 环境中部署 Hermes Agent，并接入本地大模型服务，让 Hermes 以自主智能体方式完成复杂任务执行。Hermes Agent 容器化部署接入本地 OpenAI Compatible API 模型服务安装并启用ppt-masterSkill通过 Hermes Agent 自动生成彩色 SVG PPT对比不同模型生成 18 页 PPT 的耗时和