logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《Agentx专栏》06-记忆系统:用Redis+Milvus给AI配上短期+长期双层记忆

本文介绍了AgentX技术专栏中的双层记忆架构设计,通过Redis实现短期记忆存储和Milvus实现长期记忆存储,解决LLM无状态问题。Redis存储最近20轮对话,24小时TTL自动过期,保证多实例一致性;Milvus存储语义化知识片段,支持RAG检索。文章详细解析了RedisMemoryStore的实现、Fallback机制保障高可用,以及如何与LangChain4j集成。同时总结了序列化、m

文章图片
#redis#milvus#人工智能 +3
《Agentx专栏》06-记忆系统:用Redis+Milvus给AI配上短期+长期双层记忆

本文介绍了AgentX技术专栏中的双层记忆架构设计,通过Redis实现短期记忆存储和Milvus实现长期记忆存储,解决LLM无状态问题。Redis存储最近20轮对话,24小时TTL自动过期,保证多实例一致性;Milvus存储语义化知识片段,支持RAG检索。文章详细解析了RedisMemoryStore的实现、Fallback机制保障高可用,以及如何与LangChain4j集成。同时总结了序列化、m

文章图片
#redis#milvus#人工智能 +3
《AgentX 专栏》05-RAG进阶:用Milvus+bge-m3构建比ES更懂语义的企业知识库

RAG 进阶:用 Milvus + bge-m3 构建语义企业知识库 本文介绍了如何利用 Milvus 向量数据库和 bge-m3 嵌入模型构建比传统 ES 更懂语义的企业知识库系统。文章首先分析了 ES 关键词检索在口语化查询场景下的结构性缺陷,指出向量检索通过语义相似度匹配能有效解决"用户提问与文档术语不匹配"的问题。重点讲解了 bge-m3 模型的特点(支持稠密、稀疏和多向量三种检索模式)和

文章图片
#milvus#elasticsearch#java
《Agentx专栏》04-工具系统:从@Tool注解到MCP协议,构建企业级Agent工具体系

本文深入解析了AgentX企业级工具体系的设计与实现,涵盖两种工具接入方式(@Tool注解和McpTool接口)及其适用场景。文章详细拆解了ToolRegistry的核心机制,包括自动扫描、去重保护、类型安全反射调用等关键技术点,并分享了工具描述编写对LLM决策质量的影响。通过天气工具和风控工具等实战案例,展示了生产级工具的实现细节,同时揭示了ForkJoinPool、工具命名重复等三大实战坑点。

文章图片
#人工智能#java#后端 +1
《Agentx专栏》02-技术选型:预算有限时如何做出正确的技术决策

本文分享了在有限资源条件下构建AI智能体平台AgentX的技术选型经验。作者基于3台低配云服务器(2C4G)和300元/月的预算约束,详细阐述了6个关键决策: 选择LangChain4j而非Spring AI作为AI编排框架,因其更完善的Agent/Tool支持 采用混合推理架构:本地CPU运行qwen2.5模型处理非实时任务,云端API处理高优先级请求 选用高性能但部署复杂的Milvus作为向量

文章图片
#java#架构#spring +1
《Agentx专栏》02-技术选型:预算有限时如何做出正确的技术决策

本文分享了在有限资源条件下构建AI智能体平台AgentX的技术选型经验。作者基于3台低配云服务器(2C4G)和300元/月的预算约束,详细阐述了6个关键决策: 选择LangChain4j而非Spring AI作为AI编排框架,因其更完善的Agent/Tool支持 采用混合推理架构:本地CPU运行qwen2.5模型处理非实时任务,云端API处理高优先级请求 选用高性能但部署复杂的Milvus作为向量

文章图片
#java#架构#spring +1
《AgentX 专栏》01-前言:一个Java开发者的Agent实践之路

AgentX 是我在业余时间,反复打磨出来的东西。一个普通的 Java 开发者,在不依赖大厂资源的情况下,能把企业级 AI 系统做到什么程度?答案我还在找。欢迎你一起。

文章图片
#java#人工智能#spring boot +1
《Spring AI + 大模型全栈实战》学习手册系列 · Spring AI + DeepSeek 企业级全栈落地与极限调优指南

【万字专栏】Spring AI + DeepSeek 企业级全栈落地指南 摘要:本文由资深全栈架构师分享基于Spring AI和国产大模型DeepSeek的企业级AI应用实战经验。文章涵盖:1) Spring AI 2.x架构演进,支持Java 21虚拟线程和Redis智能记忆引擎;2) 项目初始化避坑指南,包括Maven配置和DeepSeek专属接入方案;3) 核心功能实现,如流式响应(SSE)

文章图片
#人工智能#spring#java +2
Docker Compose 容器管理与自动化部署进阶指南

这份文档不仅包含基础配置,还整合了以及等实战干货。

#docker#自动化#容器
《Spring AI + 大模型全栈实战》学习手册系列 · 专题八:《RAG 系统安全与权限管理:企业级数据保护方案》

1.2 安全架构分层设计1.3 安全合规要求对照表合规标准适用场景核心要求RAG 系统对应措施等保 2.0中国政府/国企三级等保身份认证、访问控制、审计日志GDPR欧盟用户数据数据保护数据脱敏、删除权、可携带权ISO 27001国际企业信息安全安全策略、风险评估、持续改进SOC 2SaaS 服务信任服务可用性、保密性、隐私保护个人信息保护法中国用户数据隐私保护最小化收集、知情同意、安全存储第 2

#spring#人工智能#spring boot +4
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择