
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
RAG 的关键不是“有没有向量数据库”,而是能不能建立一条从用户问题到检索证据、再到可信回答的完整证据链。本文结合 RAG 论文、OpenAI/Anthropic/Microsoft/Elastic/AWS/Google 等资料,以及 LangChain、LlamaIndex、Haystack、RAGFlow、GraphRAG 等开源实践,讲清 RAG 的工程架构、常见误区和最小落地方案。

RAG 的关键不是“有没有向量数据库”,而是能不能建立一条从用户问题到检索证据、再到可信回答的完整证据链。本文结合 RAG 论文、OpenAI/Anthropic/Microsoft/Elastic/AWS/Google 等资料,以及 LangChain、LlamaIndex、Haystack、RAGFlow、GraphRAG 等开源实践,讲清 RAG 的工程架构、常见误区和最小落地方案。

很多 Agent 项目不是败在模型不够强,而是败在上下文太脏:历史全塞、RAG 全塞、工具结果全塞,最后模型又慢又贵还容易跑偏。本文从开发者视角讲清 Context Engineering、RAG、Memory、压缩、按需加载和最小落地方案。

Tool Use 的本质不是“给模型增加插件”,而是在 Model 和真实业务系统之间设计一层受控的执行权限边界。本文面向开发者,从 Function Calling、Harness、ReAct、MCP、工具设计、安全护栏和生产落地几个角度,讲清楚 Agent 工具调用为什么必须被当成权限系统来设计。

从操作系统的进程、系统调用和缓存类比 AI Agent,解释 Tool Use、上下文窗口、RAG 与 Multi-Agent 的核心作用。

从操作系统的进程、系统调用和缓存类比 AI Agent,解释 Tool Use、上下文窗口、RAG 与 Multi-Agent 的核心作用。








