
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要: 本文介绍了Agentic RAG(智能体RAG)如何通过LangGraph框架实现从静态检索到主动决策的升级。传统RAG系统存在单向流水线的缺陷,无法动态调整检索策略。Agentic RAG将大模型作为中央大脑,赋予其意图识别、路由决策和自我纠错能力。LangGraph通过状态机(State)、节点(Nodes)和条件边(Conditional Edges)实现复杂工作流编排,并演示了工业

本文探讨了如何构建RAG系统的自动化评估体系,提出利用大模型作为裁判的量化评估方法。文章首先指出传统人工评估的三大缺陷:高成本、主观性强、难以归因,进而引入"RAG Triad"评估框架,从上下文相关性、事实一致性和回答相关性三个维度进行量化分析。重点介绍了Ragas开源框架的实战应用,包括测试数据集构建、核心评估代码实现及结果分析。最后分享了测试集冷启动方案和CI/CD自动化

本文深入解析了Advanced RAG架构中的核心技术与优化策略。针对大规模知识库检索面临的"高召回、低精度"问题,提出两阶段检索方案:先通过快速向量检索(Bi-Encoder)进行粗排召回,再使用深度交互的Reranker(Cross-Encoder)对候选文档进行精排。重点介绍了基于BGE-Reranker的LangChain实现,通过设置阈值过滤和Top-N截取,显著提升

AI大模型实战:LangChain构建HR智能问答系统与混合检索架构 本文介绍了使用LangChain框架构建企业HR智能问答系统的实战方法。首先阐述了LangChain在RAG系统中的核心价值,通过组件化和链式编排简化开发流程。随后详细演示了HR问答系统的实现代码,包括向量数据库挂载、大模型初始化、Prompt模板设计等关键环节,特别强调了低temperature参数和Prompt防御机制的重要

摘要 本文介绍了向量数据库在AI大模型实战中的关键作用,重点解析了传统数据库无法高效处理向量检索的原因,以及向量数据库通过ANN算法实现毫秒级查询的底层原理。文章对比了Pinecone、Milvus、Faiss和Chroma等主流向量数据库的优缺点,并推荐轻量级的Chroma作为中小型项目的首选。最后通过代码示例演示了Chroma的本地实战操作,包括数据持久化、集合创建、向量入库及混合过滤检索,为

本文深入探讨企业级RAG系统的数据管道构建,聚焦文档解析、分块策略和向量化三大核心环节。首先指出复杂文档(PDF/Word等)的解析痛点,提出多级解决方案;其次分析文本分块技术,从基础字符切分到高级语义分块;然后详解向量化原理,比较在线API与本地部署方案,推荐使用Ollama框架部署bge-m3模型;最后介绍向量相似度计算方法。文章强调数据质量决定RAG系统上限,为后续向量数据库选型奠定基础。

本文深入探讨企业级RAG系统的数据管道构建,聚焦文档解析、分块策略和向量化三大核心环节。首先指出复杂文档(PDF/Word等)的解析痛点,提出多级解决方案;其次分析文本分块技术,从基础字符切分到高级语义分块;然后详解向量化原理,比较在线API与本地部署方案,推荐使用Ollama框架部署bge-m3模型;最后介绍向量相似度计算方法。文章强调数据质量决定RAG系统上限,为后续向量数据库选型奠定基础。

本文深入探讨企业级RAG系统的数据管道构建,聚焦文档解析、分块策略和向量化三大核心环节。首先指出复杂文档(PDF/Word等)的解析痛点,提出多级解决方案;其次分析文本分块技术,从基础字符切分到高级语义分块;然后详解向量化原理,比较在线API与本地部署方案,推荐使用Ollama框架部署bge-m3模型;最后介绍向量相似度计算方法。文章强调数据质量决定RAG系统上限,为后续向量数据库选型奠定基础。

摘要:本文剖析了大语言模型(LLM)的三大固有缺陷——知识时效性差、垂直领域覆盖不足和幻觉问题,指出传统方法(提示词工程和微调)的局限性。重点阐述了RAG(检索增强生成)架构的核心价值:通过"检索+生成"的分离设计,将外部知识库与大模型能力结合,实现精准问答。文章详细拆解了RAG系统的三阶段流程(索引构建、语义检索、增强生成),并论证其作为企业AI落地首选方案的四大优势:结果可

在人工智能技术日新月异的今天,大模型应用开发已经成为开发者们的必修课。本文将详细梳理本阶段学习的前置要求,并手把手教你完成 Python 依赖安装、虚拟环境进阶以及大模型 API-KEY 的安全配置。








