搞skill比搞向量库简单多了，要干的事全搞成skill就好了

njsgcs

41人浏览 · 2026-06-29 20:32:09

njsgcs · 2026-06-29 20:32:09 发布

从开发者的角度来看，把一切任务“技能化”确实能显著降低系统的复杂度和不确定性。技能（Skills/Tools）本质上是给模型提供了确定性的逻辑入口，你只需要定义好清晰的输入输出协议，模型就能像调用函数一样精准地完成任务，这比在向量库里反复调优 Top-K 检索或者是处理 embedding 的语义漂移要直观得多。

不过，向量库和技能其实各司其职。技能擅长处理“动作”和“结构化查询”，比如去查个数据库、写个文件或者调个 API。而向量库的核心价值在于处理海量的“非结构化知识”，当你有几万篇文档需要根据模糊的语义进行匹配时，把它们全部硬编码成技能是不太现实的。

现在的趋势也确实在往你说的这个方向靠拢，即“能用工具解决的就别靠检索”。通过增加高质量的工具（Skill），可以让 AI 从一个只能“读后感”的知识库变成一个真正能“干活”的 Agent，这种设计思路在工程落地时往往也更容易维护和 Debug。

你提到的“逻辑检索”确实切中了当前 RAG（检索增强生成）演进的核心痛点。传统的向量检索本质上是“模糊语义匹配”，它能告诉你哪些内容“长得像”，但无法理解内容之间的“逻辑关系”。

目前的趋势正是将**结构化逻辑（Skill/Symbolic）与非结构化语义（Vector/Neural）**相结合。这种“逻辑检索”通常体现在以下几个层面：

1. 从语义匹配到逻辑推理 (Logic-Aware Retrieval)

传统的 RAG 往往在处理多步推理或逻辑关联时失效。例如，HopRAG 等最新研究指出，单纯依赖语义相似度无法处理复杂的逻辑依赖。

多跳逻辑： 系统不再只检索一个片段，而是根据第一个片段的逻辑线索去寻找第二个片段（Multi-hop）。
本体对齐： 像 OG-RAG 这种方法，会将检索锚定在领域特定的本体（Ontology）上，确保检索结果符合逻辑规范，而不是随机的语义碎片。

2. 神经符号检索 (Neuro-Symbolic RAG)

这正是你说的“把 Skill 和检索结合”的体现。比如 NeuSym-RAG 提出的混合架构：

符号层（Skill/Logic）： 负责处理结构化的元数据、时间戳、量化指标等“硬约束”。
神经层（Vector）： 负责处理描述性的“软语义”。
查询编译器： 最新的研究如 Neuro-Symbolic Query Compiler 能够将用户的自然语言指令编译成逻辑查询语句（如 SQL 或图查询），从而实现精准定位。

3. 图结构的引入 (GraphRAG)

GraphRAG 是目前“逻辑检索”最典型的落地方式。它不仅存储向量，还存储实体间的关系（A 导致了 B，C 是 D 的一部分）。

分层摘要： 能够跨文档总结逻辑脉络，而不仅仅是拼接文本块。
关系检索： 检索出的不再是孤立的文本，而是一个包含上下文逻辑的子图。

总结

你所倡导的“搞 Skill”和“逻辑检索”其实是殊途同归：本质上都是在给 AI 的黑盒里注入“确定性”。

检索方式	核心原理	优势	劣势
纯向量检索	语义相似度 (Cosine Similarity)	简单、通用、支持模糊查询	容易产生幻觉，无法理解逻辑因果
逻辑/技能检索	逻辑表达式/知识图谱/API 调用	精准、可解释、逻辑严密	构建成本高，对非结构化数据处理弱
混合检索 (趋势)	语义向量 + 逻辑约束	兼顾灵活性与准确性	系统复杂度最高

正如你所感知的，当任务变得复杂时，单纯靠堆向量确实不如给模型写一套清晰的逻辑 Skill 来得高效。目前的尖端研究也正是在尝试通过“神经符号”化的方式，让检索本身具备逻辑性。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

Havenlon 对抗性完整（八）：我们默认不应该相信任何人，包括我们自己

龙虾开发者社区

2026企业级AI Agent落地全指南：深耕非侵入式架构与智能体自动化转型实战

龙虾开发者社区

Agent 不是更聪明的模型，而是长了手脚的模型

文章摘要：本文通过7层能力框架解析AI Agent的核心能力与局限。Agent并非单纯更聪明的模型，而是由模型（大脑）、工具（手脚）和协议（神经系统）组成的完整架构。其能力金字塔包含：①读取系统状态、②动手验证假设、③多步诊断链、④修改系统配置、⑤试错循环、⑥任务规划拆解、⑦连接外部世界。与裸模型相比，Agent能主动执行命令、诊断问题、迭代修正并自主规划任务，如升级驱动、调试代码等。关键在于Ag