logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

00:RAG 概述与核心概念

RAG(检索增强生成)是一种结合检索与生成能力的技术框架,由Meta在2020年提出。其核心工作流程包括索引(文档分块、向量化存储)、检索(查询向量化、相似度匹配)和生成(基于检索结果生成回答)三个阶段。RAG通过动态检索外部知识库,解决了传统LLM的知识时效性、幻觉问题和专业领域知识不足等局限。关键技术组件包括Embedding模型、向量数据库和检索器/生成器。优化策略涵盖混合检索、重排序和查询

文章图片
#人工智能
06:Agent 规划机制(Planning)

本文系统梳理了Agent规划的核心能力,包括思维链(CoT)、ReAct、思维树(ToT)和规划执行(Plan-and-Execute)四大范式,详细解析了任务分解的三种策略(逐步、层级、并行),并探讨了自我反思机制与执行监控方法。文章还介绍了记忆增强规划和主流开源框架(如LangChain),为构建具备复杂任务处理能力的智能Agent提供了全面的技术路线和工程实践指导。

文章图片
#java#人工智能
03:Agent三大设计范式

本文概述了Agent设计的三大范式:ReAct、Plan-and-Execute和Reflection。ReAct通过交替推理与行动实现灵活交互,适合简单任务但缺乏全局视角;Plan-and-Execute先规划后执行,适合复杂任务但成本较高;Reflection通过评估和重试提升输出质量,但延迟和成本显著增加。文章提供了Java伪代码示例,并给出工程化建议,包括设置资源预算、日志记录和评估规则化

文章图片
#开发语言#java
05:Agent 记忆机制(Memory)

Agent记忆系统分为感知记忆(原始输入)、短期记忆(上下文窗口)、长期记忆(跨任务存储)和实体记忆(结构化事实)。核心设计需解决存什么(关键信息筛选)、怎么存(混合存储策略)和何时取(主动/被动检索)。通过滑动窗口、摘要压缩和分层卸载管理上下文限制,并整合去重、冲突消解和知识提炼优化记忆质量。知识图谱可增强记忆关联性,而向量数据库+结构化存储的混合方案是主流实践。完整闭环需实现"读取-

文章图片
#java#人工智能
04:复杂任务拆分(Task Split)

任务拆分是提升Agent性能的关键策略,主要动机包括突破LLM上下文限制、降低错误传播风险和提高并行效率。设计方式分为三类:静态拆分(预定义流程)、动态拆分(LLM实时规划)和自适应递归拆分(失败时细化步骤)。工程要点包括粒度控制、依赖分析、并行调度和Replan机制,每步需明确验收标准。验证准则要求拆分结果具备完备性、独立性和可验证性。典型流程采用Planner-Executor-Aggrega

文章图片
#java#人工智能
02:Workflow、Agent、Tools 的概念与区别

本文探讨了AI系统中的三个核心概念:Tools、Agent和Workflow的区别与联系。Tools是最小能力单元,提供具体函数功能;Agent是自主决策主体,能灵活调用Tools;Workflow则是开发者预设的执行流程。三者可组合使用,形成Agentic Workflow模式,兼顾灵活性与可控性。文章还介绍了常见编排模式(如提示链、路由、并行化等)和工程实践建议,强调要在关键节点嵌入Agent

文章图片
#java#人工智能
01:Agent架构及其核心组件

摘要: Agent系统以LLM为决策核心,通过工具系统、记忆系统和规划模块协同工作,实现目标分解与任务执行。核心组件包括:LLM负责意图理解与决策;工具系统封装外部能力接口;记忆系统管理短期/长期状态;规划模块拆解复杂目标。工程挑战涉及模型选择、上下文限制、记忆噪声和工具可靠性等问题。实践建议从最小闭环开始,逐步扩展记忆、规划和异常处理功能,注重测试覆盖率和成本控制。关键点在于明确System P

文章图片
#java#人工智能
00:初识Agent

Agent是具备自主规划与动态执行能力的AI系统,其核心在于形成"目标→拆解→执行→反馈→调整"的闭环,而非简单的工具调用。与LLM相比,Agent能主动推进多步任务、保持持续状态并实现真实动作执行。典型架构包含决策模型、工具层、记忆层和控制层,通过"感知-规划-行动-再感知"循环动态调整策略。常见设计范式包括ReAct(边推理边行动)、Plan-and-E

文章图片
#java#人工智能
使用Spring AI Alibaba框架搭建一个Agent Demo: Ai简历魔法师 (个人学习项目)

本文介绍了如何使用Spring AI Alibaba框架搭建一个名为"AI简历魔法师"的智能代理Demo。该项目基于Spring Boot 3.3.5和Spring AI 1.1.2技术栈,结合PostgreSQL和pgvector实现简历文档解析、知识库检索(RAG)、智能工具调用等核心功能。文章详细讲解了环境准备、项目初始化、核心配置以及PostgreSQL+pgvecto

文章图片
#spring#java#人工智能 +1
Windows系统环境下的Dify配置踩坑指南(WSL2 + Docker 环境)

Windows下Dify配置常见问题解决方案 本文总结了在Windows 11(WSL2+Docker)环境下部署Dify 1.13.3时遇到的典型问题及解决方案: 管理员设置500错误:因PostgreSQL权限问题导致,需修改docker-compose.yaml将数据卷改为命名卷,启动时需加--profile postgresql参数 Weaviate连接失败:同样因profile配置导致服

文章图片
#windows#docker#容器 +1
到底了