logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从“能召回”到“召回准”:RAG 检索优化与幻觉控制实践总结

RAG系统优化:从基础检索到精准问答 摘要:RAG(检索增强生成)系统远非简单的"向量检索+大模型回答"组合。一个高效的RAG系统需要解决多个关键问题:如何提高召回准确率、优化结果排序、确保上下文可信度并减少大模型幻觉。完整的RAG流程包括离线知识入库和在线问答两条链路,涉及查询改写、多Query扩展、混合检索(向量+BM25)、RRF结果融合、重排序等多个优化环节。特别需要关注幻觉控制,通过提高

文章图片
#AIGC#人工智能#学习
Agent 记忆机制到底怎么理解?从短期记忆、长期记忆到记忆压缩。

Agent的记忆机制是多层次的信息管理系统,旨在解决大模型缺乏持久记忆的问题。短期记忆通过滑动窗口保留最近对话,受限于上下文长度;长期记忆存储用户偏好、任务经验等关键信息,借助外部数据库实现持久化,与RAG技术类似但目标不同(RAG补充知识,记忆维持个性化)。复杂Agent可采用三层记忆架构(工作记忆/短期/长期),结合压缩、检索和动态更新,确保连续性。记忆系统的核心是精准管理而非简单堆积,需平衡

文章图片
#oracle#数据库#jvm +2
从文件上传到 RAG 检索:真正看懂了一个 AI 项目的知识库链路

本文深入解析了RAG(检索增强生成)系统的完整工程实现链路。系统首先通过分片上传处理大文件存储到MinIO,使用Kafka异步处理解析任务,Tika工具提取多格式文件文本内容。核心环节包括文本切片(采用固定长度+重叠区段)、向量化存储和元数据管理,Elasticsearch同时支持关键词检索和向量相似度搜索。当用户提问时,系统通过向量匹配召回相关文本片段,结合大模型生成回答。文章特别强调工程实践中

文章图片
#人工智能#java#经验分享
从单 Agent 到多 Agent,理解智能体协作设计

今天继续学习 AI Agent,从单 Agent 进一步理解多 Agent 协作设计,重点梳理了 Supervisor、Planner、Executor、Plan-Execute-Replan、ReAct、outputKey、Flux、SSE 和 ChatMemory 等概念,逐步认识到 Agent 项目不仅是调用工具,更重要的是任务规划、状态传递、角色协作与上下文管理。

文章图片
#AIGC#人工智能#学习
从概念理解走向 Java Agent 项目实战

本文记录了 AI Agent 学习的内容:从昨天的概念理解,进一步进入 Java Agent 项目实战。主要学习了 Spring AI、ChatClient、conversationId 会话隔离、Memory 记忆、RAG 检索增强生成、Vector Store 与 Milvus 向量数据库。同时结合项目中遇到的接口 404、Milvus 连接失败等问题,理解 Agent 工程落地不仅需要大模型

文章图片
#java#人工智能#经验分享
从 Java 开发者视角理解 AI Agent

本文从 Java 开发者视角出发,梳理了 AI Agent 的基本概念、核心组成与工作流程。Agent 以大语言模型为大脑,结合 Prompt、Tools、Memory 和 Planning,实现任务理解、步骤规划、工具调用与结果反馈。通过与传统 Java 后端开发对比,可以更清晰地理解 Agent 的工程化价值,也为后续学习大模型 API、Tool Calling、RAG 和 Agent 项目实

文章图片
#人工智能#java#开发语言
从 Java 开发者视角理解 AI Agent

本文从 Java 开发者视角出发,梳理了 AI Agent 的基本概念、核心组成与工作流程。Agent 以大语言模型为大脑,结合 Prompt、Tools、Memory 和 Planning,实现任务理解、步骤规划、工具调用与结果反馈。通过与传统 Java 后端开发对比,可以更清晰地理解 Agent 的工程化价值,也为后续学习大模型 API、Tool Calling、RAG 和 Agent 项目实

文章图片
#人工智能#java#开发语言
AI 学习日志:继续构建我的 AI / Agent学习路线

今天的学习主要围绕 AI 应用开发与 Agent 思维 展开。通过学习,我认识到 AI 不只是聊天工具,而是可以通过 Prompt、上下文、工具调用、知识库和任务规划,完成更复杂的任务流程。结合 Java 基础,我理解到 AI 应用开发并不是放弃后端能力,而是在 Java 工程体系中接入大模型能力。Java 负责接口、业务、数据和部署,AI 负责理解、生成、总结和规划。今天还遇到了 Docker

文章图片
#人工智能#学习#java
从 Web Agent 应用到执行型 Agent

最近在学习 AI Agent 的过程中,我发现一个很有意思的问题:很多所谓的 Agent 项目,看起来依然是基于 Web 框架开发的,比如 Spring Boot、FastAPI、Vue、React,再接入大模型 API、RAG、工具调用等能力。这让我产生了一个疑问:Agent 不是应该可以自己思考、自己找信息、自己调用工具,甚至像 Codex、Claude Code、Cursor Agent 那

文章图片
#AIGC
找实习有感:拒绝上海小厂全栈 AI Offer

这篇文章记录了我从寒假计划准备实习,到开学后补八股、改简历、海投、面试,再到拿到上海小厂全栈 AI 实习 offer 后选择拒绝的全过程。过程中有焦虑、有自我怀疑,也有对学业、实习和个人成长的重新思考。最后我意识到,找实习不只是为了证明自己,更重要的是找到适合自己的节奏,继续补强 AI、刷算法、写博客,在长期主义中慢慢成长。

文章图片
#java#经验分享
到底了