logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RAG 不是向量数据库,而是在给大模型建立证据链

RAG 的关键不是“有没有向量数据库”,而是能不能建立一条从用户问题到检索证据、再到可信回答的完整证据链。本文结合 RAG 论文、OpenAI/Anthropic/Microsoft/Elastic/AWS/Google 等资料,以及 LangChain、LlamaIndex、Haystack、RAGFlow、GraphRAG 等开源实践,讲清 RAG 的工程架构、常见误区和最小落地方案。

文章图片
#人工智能#架构
RAG 不是向量数据库,而是在给大模型建立证据链

RAG 的关键不是“有没有向量数据库”,而是能不能建立一条从用户问题到检索证据、再到可信回答的完整证据链。本文结合 RAG 论文、OpenAI/Anthropic/Microsoft/Elastic/AWS/Google 等资料,以及 LangChain、LlamaIndex、Haystack、RAGFlow、GraphRAG 等开源实践,讲清 RAG 的工程架构、常见误区和最小落地方案。

文章图片
#人工智能#架构
Context Engineering 不是写更长 Prompt,而是管理 Agent 的注意力预算

很多 Agent 项目不是败在模型不够强,而是败在上下文太脏:历史全塞、RAG 全塞、工具结果全塞,最后模型又慢又贵还容易跑偏。本文从开发者视角讲清 Context Engineering、RAG、Memory、压缩、按需加载和最小落地方案。

文章图片
#数据库
Tool Use 不是给大模型装插件,而是在设计 Agent 的执行权限系统

Tool Use 的本质不是“给模型增加插件”,而是在 Model 和真实业务系统之间设计一层受控的执行权限边界。本文面向开发者,从 Function Calling、Harness、ReAct、MCP、工具设计、安全护栏和生产落地几个角度,讲清楚 Agent 工具调用为什么必须被当成权限系统来设计。

文章图片
#人工智能#架构
用操作系统类比彻底搞懂 AI Agent:进程、系统调用与上下文窗口

从操作系统的进程、系统调用和缓存类比 AI Agent,解释 Tool Use、上下文窗口、RAG 与 Multi-Agent 的核心作用。

文章图片
#人工智能
用操作系统类比彻底搞懂 AI Agent:进程、系统调用与上下文窗口

从操作系统的进程、系统调用和缓存类比 AI Agent,解释 Tool Use、上下文窗口、RAG 与 Multi-Agent 的核心作用。

文章图片
#人工智能
到底了