logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LangChain 非分割类型的文档转换器使用技巧

本文介绍了LangChain中的文档转换器组件及其应用场景。文档转换器可接收并返回文档列表,适用于LLM应用中的多个环节,如文档加载、切割和检索。重点介绍了两种转换器:1) 问答转换器(DoctranQATransformer),将文本转换为问答格式以提升检索相关性;2) 翻译转换器(DoctranTextTranslator),支持跨语言文档转换。两种转换器均基于OpenAI API实现,通过t

文章图片
#人工智能#python
自定义 LangChain 文档加载器使用技巧

本文介绍了自定义文档加载器的实现技巧。针对企业特殊数据需求,通用加载器可能无法满足格式要求,此时可通过继承BaseLoader基类实现自定义加载器。文章展示了如何实现lazy_load()和alazy_load()方法逐行读取文件并生成Document对象,包含行号和源文件等元数据。同时提出文档加载可分解为"二进制数据读取+解析逻辑"两个步骤,建议将解析与加载逻辑分离以提高复用

文章图片
#数据库#python#人工智能
利用LangGraph优化LLMOps聊天机器人图架构

本文介绍了LLMOps聊天机器人架构的优化过程。通过整合记忆、知识库检索和格式化输出等功能,并使用LangGraph构建包含条件边和循环结构的图架构。文章重点分析了数据状态与外部配置的分离设计,提出通过动态配置实现模型切换、工具绑定、知识库关联和内容审核等功能,使应用成为可根据配置灵活调整的黑盒系统。同时阐述了如何通过分析节点数据需求来构建完整的状态数据,最终实现一个可根据用户查询和配置动态生成不

文章图片
#人工智能#python#架构
Weaviate向量数据库的配置与使用

摘要: Weaviate是一款基于Go语言的开源向量数据库,提供多种部署方式:云服务(14天免费试用)、Docker容器、K8s集群和Linux/macOS嵌入式部署。其核心概念"集合"类似关系型数据库的表,命名需遵循大写字母开头的规范。使用流程包括部署实例、安装Python客户端、创建集合、添加向量数据和执行相似性搜索。Weaviate支持REST/gRPC协议连接,提供原生

文章图片
#人工智能#python
LangGraph 需求转换图架构的技巧-CRAG实现

本文介绍了CRAG(纠正性索引增强生成)优化策略的实现方法。该策略通过评估器判断检索文档质量,动态选择精炼文档或网络检索路径。文章详细讲解了使用LangGraph构建条件分支工作流的方法,包括:1) 节点设计(检索、评分、生成等);2) 数据状态管理;3) 工作流编排(条件边、循环等)。实现中整合了Weaviate向量数据库、Google搜索API和GPT-4模型,展示了从检索到生成的完整流程。该

文章图片
#人工智能#python
LangChain RunnableWithMessageHistory简化代码与使用

本文介绍了LangChain中RunnableWithMessageHistory类的使用方法,该工具类可自动管理聊天历史记录。主要内容包括: 核心功能:通过会话ID管理不同用户的对话历史,自动填充和存储消息 关键配置参数:包括输入输出消息键、历史消息键及会话历史工厂函数 实现示例:展示了完整的代码实现流程,包含历史存储初始化、链构建和包装过程 内部机制:解析了该类的运行流程,包括历史记录的加载、

文章图片
#前端#python#人工智能
LangGraph两种基础流式响应技巧

摘要:LangGraph提供两种流式响应模式:"values"(返回完整状态)和"updates"(返回增量更新)。通过stream_mode参数可切换模式,但当前实现仍存在响应延迟问题,特别是LLM节点需要内部流式支持才能提升效率。理想方案应结合节点级流式输出和内部事件流,类似主流Agent工具(如Coze、GPTs)的交互体验。该功能将在后续章节深入探讨

文章图片
#python#人工智能
Weaviate向量数据库的配置与使用

摘要: Weaviate是一款基于Go语言的开源向量数据库,提供多种部署方式:云服务(14天免费试用)、Docker容器、K8s集群和Linux/macOS嵌入式部署。其核心概念"集合"类似关系型数据库的表,命名需遵循大写字母开头的规范。使用流程包括部署实例、安装Python客户端、创建集合、添加向量数据和执行相似性搜索。Weaviate支持REST/gRPC协议连接,提供原生

文章图片
#人工智能#python
LangChain RAG-递归文档树检索实施高级RAG优化理解

RAPTOR递归文档树是一种新型RAG优化策略,通过树状结构组织文本检索,解决长文本处理问题。其核心流程包括:文本分块→向量化→降维→聚类→LLM摘要→递归构建层次结构。相比传统方法,RAPTOR在保持高准确性的同时显著降低成本,支持多文档和超长上下文处理。论文提出了两种检索策略(树遍历和折叠树),后者因效率更高被推荐。实现上采用UMAP降维和GMM聚类,但存在数据更新复杂的缺陷。该技术适用于需要

文章图片
#人工智能#python
LangChain RAG-MultiVector实现多向量检索文档

本文介绍了多表征/向量索引技术及其实现方法。该技术通过从多个维度记录文档块信息(如切割更小块、生成摘要或假设性问题),为每个文档块生成多条特征向量,从而提高检索命中率。文章详细阐述了多向量检索的运行流程,并提供了基于LangChain框架的代码示例。示例展示了如何使用FAISS向量数据库和本地文件存储实现"摘要检索原文"策略,以及如何通过生成假设性问题来优化检索效果。此外,还介

文章图片
#数据库#人工智能#python
    共 28 条
  • 1
  • 2
  • 3
  • 请选择