logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI大模型实战系列(八):从静态检索到主动决策——Agentic RAG(智能体 RAG)与 LangGraph 工业级编排

摘要: 本文介绍了Agentic RAG(智能体RAG)如何通过LangGraph框架实现从静态检索到主动决策的升级。传统RAG系统存在单向流水线的缺陷,无法动态调整检索策略。Agentic RAG将大模型作为中央大脑,赋予其意图识别、路由决策和自我纠错能力。LangGraph通过状态机(State)、节点(Nodes)和条件边(Conditional Edges)实现复杂工作流编排,并演示了工业

文章图片
#人工智能
AI大模型实战系列(七):量化黑盒——构建 RAG 系统的自动化评估体系与核心指标

本文探讨了如何构建RAG系统的自动化评估体系,提出利用大模型作为裁判的量化评估方法。文章首先指出传统人工评估的三大缺陷:高成本、主观性强、难以归因,进而引入"RAG Triad"评估框架,从上下文相关性、事实一致性和回答相关性三个维度进行量化分析。重点介绍了Ragas开源框架的实战应用,包括测试数据集构建、核心评估代码实现及结果分析。最后分享了测试集冷启动方案和CI/CD自动化

文章图片
#人工智能#自动化#运维
AI大模型实战系列(六):大浪淘沙——Advanced RAG 架构与 Reranker 重排深度解析

本文深入解析了Advanced RAG架构中的核心技术与优化策略。针对大规模知识库检索面临的"高召回、低精度"问题,提出两阶段检索方案:先通过快速向量检索(Bi-Encoder)进行粗排召回,再使用深度交互的Reranker(Cross-Encoder)对候选文档进行精排。重点介绍了基于BGE-Reranker的LangChain实现,通过设置阈值过滤和Top-N截取,显著提升

文章图片
#人工智能#架构
AI大模型实战系列(五):LangChain 链路打通——构建 HR 智能问答系统与混合检索架构揭秘

AI大模型实战:LangChain构建HR智能问答系统与混合检索架构 本文介绍了使用LangChain框架构建企业HR智能问答系统的实战方法。首先阐述了LangChain在RAG系统中的核心价值,通过组件化和链式编排简化开发流程。随后详细演示了HR问答系统的实现代码,包括向量数据库挂载、大模型初始化、Prompt模板设计等关键环节,特别强调了低temperature参数和Prompt防御机制的重要

文章图片
#人工智能#架构
AI大模型实战系列(四):向量数据库架构揭秘与 Chroma 本地实战

摘要 本文介绍了向量数据库在AI大模型实战中的关键作用,重点解析了传统数据库无法高效处理向量检索的原因,以及向量数据库通过ANN算法实现毫秒级查询的底层原理。文章对比了Pinecone、Milvus、Faiss和Chroma等主流向量数据库的优缺点,并推荐轻量级的Chroma作为中小型项目的首选。最后通过代码示例演示了Chroma的本地实战操作,包括数据持久化、集合创建、向量入库及混合过滤检索,为

文章图片
#人工智能#数据库架构#数据库
AI大模型实战系列(三):数据重塑——文档解析、分块策略与向量化底层实操指南

本文深入探讨企业级RAG系统的数据管道构建,聚焦文档解析、分块策略和向量化三大核心环节。首先指出复杂文档(PDF/Word等)的解析痛点,提出多级解决方案;其次分析文本分块技术,从基础字符切分到高级语义分块;然后详解向量化原理,比较在线API与本地部署方案,推荐使用Ollama框架部署bge-m3模型;最后介绍向量相似度计算方法。文章强调数据质量决定RAG系统上限,为后续向量数据库选型奠定基础。

文章图片
#人工智能
AI大模型实战系列(三):数据重塑——文档解析、分块策略与向量化底层实操指南

本文深入探讨企业级RAG系统的数据管道构建,聚焦文档解析、分块策略和向量化三大核心环节。首先指出复杂文档(PDF/Word等)的解析痛点,提出多级解决方案;其次分析文本分块技术,从基础字符切分到高级语义分块;然后详解向量化原理,比较在线API与本地部署方案,推荐使用Ollama框架部署bge-m3模型;最后介绍向量相似度计算方法。文章强调数据质量决定RAG系统上限,为后续向量数据库选型奠定基础。

文章图片
#人工智能
AI大模型实战系列(三):数据重塑——文档解析、分块策略与向量化底层实操指南

本文深入探讨企业级RAG系统的数据管道构建,聚焦文档解析、分块策略和向量化三大核心环节。首先指出复杂文档(PDF/Word等)的解析痛点,提出多级解决方案;其次分析文本分块技术,从基础字符切分到高级语义分块;然后详解向量化原理,比较在线API与本地部署方案,推荐使用Ollama框架部署bge-m3模型;最后介绍向量相似度计算方法。文章强调数据质量决定RAG系统上限,为后续向量数据库选型奠定基础。

文章图片
#人工智能
AI大模型实战系列(二):破除神话,深研 RAG(检索增强生成)的核心本质与底层逻辑

摘要:本文剖析了大语言模型(LLM)的三大固有缺陷——知识时效性差、垂直领域覆盖不足和幻觉问题,指出传统方法(提示词工程和微调)的局限性。重点阐述了RAG(检索增强生成)架构的核心价值:通过"检索+生成"的分离设计,将外部知识库与大模型能力结合,实现精准问答。文章详细拆解了RAG系统的三阶段流程(索引构建、语义检索、增强生成),并论证其作为企业AI落地首选方案的四大优势:结果可

文章图片
#人工智能
AI大模型实战系列(一):RAG开发前置知识与环境搭建完全指南

在人工智能技术日新月异的今天,大模型应用开发已经成为开发者们的必修课。本文将详细梳理本阶段学习的前置要求,并手把手教你完成 Python 依赖安装、虚拟环境进阶以及大模型 API-KEY 的安全配置。

文章图片
#人工智能
    共 14 条
  • 1
  • 2
  • 请选择