logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

历史对话关联 RAG 上下文检索 — 内部技术介绍

在多轮对话场景中,用户的后续提问往往依赖历史上下文(如指代“它”“那个方案”或省略主题)。传统 RAG 系统仅处理单轮 query,无法有效捕捉对话依赖关系。本文说明如何将对话历史融入检索过程,构建对话式 RAG 上下文检索系统。读完本文你将掌握:多轮 RAG 系统实现中的上下文维护方案、历史对话 RAG 查询压缩的基本原理,以及使用 LangChain、LlamaIndex 完成实战编码的思路。

#数据库#oracle#服务器
【Next.js实战②】Excel 派送表动态解析:表头识别与 FIELD_ALIASES 映射

本文针对货代/物流场景中Gmail附件派送表解析的痛点,提出了一套动态识别表头的解决方案。文章详细介绍了五步解析流水线:将文件读成二维矩阵、检测表头行、建立列映射、逐行解析并记录警告、按仓库汇总箱数。系统采用别名映射机制兼容不同模板,支持xlsx和csv格式,通过动态识别和标准化处理解决了列名不统一问题。解析结果包含明细数据、仓库汇总和警告信息,设计上强调数据挽救而非直接拒绝。最后给出了与Gmai

#javascript#前端
【Next.js实战①】Gmail API 按柜号检索邮件:OAuth 双 Cookie 与搜索 Fallback

本文介绍了如何通过Next.js与Gmail API实现物流业务中的邮件自动化处理方案。重点包括:1)采用独立OAuth授权流程管理Gmail访问权限;2)设计双重Cookie机制隔离系统登录与Gmail访问;3)实现基于柜号的智能邮件搜索策略,支持发件人优先与全范围搜索的fallback机制;4)开发附件解析与评分系统,自动选取最佳邮件;5)优化事务处理边界,避免网络请求影响数据库事务。该方案将

#javascript#开发语言#ecmascript
RAGAS框架使用指南:从入门到高效评估RAG系统

本文介绍了RAGAS框架在评估RAG系统中的应用价值,重点解析了其核心评估指标和原理。RAGAS通过量化分析问题、标准答案、检索上下文和生成答案之间的关系,提供客观的评估指标,包括忠实性(答案与上下文一致性)、答案相关性(回答针对性)、上下文精度(检索结果信噪比)和上下文召回(信息覆盖率)。文章还详细说明了各指标的计算方法和应用场景,帮助开发者精准定位RAG系统瓶颈,实现从主观评估到数据驱动的优化

#python#知识图谱
RAG系统检索结果优化策略

本文围绕RAG检索结果优化,系统性地介绍了检索前、检索中、检索后三个阶段的策略。建立评估基线:标准测试用例 + 初始指标记录,是优化可追溯的前提。检索前:多轮对话改写、实体消歧能显著提升查询质量。检索中:语义切分 + 元数据嵌入是最具性价比的改进手段;标签设计须与智能体提示词配合。检索后:RRF适合快速融合;Cross-Encoder适合精排;分层管道兼顾效率与精度。参数调优:相似度阈值、召回片段

#大数据#人工智能#算法
ollama 常用命令

Ollama常用命令指南:基础操作包括下载模型(pull)、运行模型(run)并支持参数调整(如温度、最大token数)、查看本地模型(list)和删除模型(rm)。高级功能涵盖硬件加速选择(GPU/CPU)、后台运行(detach)、批量推理(generate)和日志查看(logs)。参数调优支持随机性控制(temp)、内容过滤(moderate)等。典型场景如快速测试模型、代码生成和磁盘清理。

#语言模型#gpt-3
网页端嵌入 Agent 对接前端方案

当前前端项目正从被动展示走向主动交互,AI Agent 嵌入网页端可自动化 UI 操作、优化布局并辅助编码。本文聚焦如何在前端(React/Vue3)中集成 AI Agent,涵盖客户端工具定义、安全通信及流式输出等核心环节。读完本文,你将掌握:React 集成 AG-UI 组件、Vue3 对接 Agent 流式输出、前端 Agent 安全通信实现、LangChain 前端 Agent 对接的基本

#状态模式
网页端嵌入 Agent 对接前端方案

当前前端项目正从被动展示走向主动交互,AI Agent 嵌入网页端可自动化 UI 操作、优化布局并辅助编码。本文聚焦如何在前端(React/Vue3)中集成 AI Agent,涵盖客户端工具定义、安全通信及流式输出等核心环节。读完本文,你将掌握:React 集成 AG-UI 组件、Vue3 对接 Agent 流式输出、前端 Agent 安全通信实现、LangChain 前端 Agent 对接的基本

#状态模式
对话框打字机效果:Vur + Java/Python 实现

选型:SSE 是 AI 文本流式输出的推荐方案,比 WebSocket 更轻量、实现更简单。前端实现:Vue 3 Composition API 配合逐块解析 SSE 数据,使用支持用户中止。后端实现:Java Spring Boot 使用SseEmitter,Python FastAPI 使用,两者均需设置头部。生产级处理:缓冲区解决数据包截断问题,DOMPurify防御 XSS,v-memo与

#java#python#开发语言
历史对话关联 RAG 上下文检索 — 内部技术介绍

在多轮对话场景中,用户的后续提问往往依赖历史上下文(如指代“它”“那个方案”或省略主题)。传统 RAG 系统仅处理单轮 query,无法有效捕捉对话依赖关系。本文说明如何将对话历史融入检索过程,构建对话式 RAG 上下文检索系统。读完本文你将掌握:多轮 RAG 系统实现中的上下文维护方案、历史对话 RAG 查询压缩的基本原理,以及使用 LangChain、LlamaIndex 完成实战编码的思路。

#数据库#oracle#服务器
    共 14 条
  • 1
  • 2
  • 请选择