wx5701619 个人主页

@wx5701619

wx5701619

2024-09-02 14:19:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

《Agentx专栏》06-记忆系统：用Redis+Milvus给AI配上短期+长期双层记忆

本文介绍了AgentX技术专栏中的双层记忆架构设计，通过Redis实现短期记忆存储和Milvus实现长期记忆存储，解决LLM无状态问题。Redis存储最近20轮对话，24小时TTL自动过期，保证多实例一致性；Milvus存储语义化知识片段，支持RAG检索。文章详细解析了RedisMemoryStore的实现、Fallback机制保障高可用，以及如何与LangChain4j集成。同时总结了序列化、m

#redis #milvus #人工智能 +3

《Agentx专栏》06-记忆系统：用Redis+Milvus给AI配上短期+长期双层记忆

#redis #milvus #人工智能 +3

《AgentX 专栏》05-RAG进阶：用Milvus+bge-m3构建比ES更懂语义的企业知识库

RAG 进阶：用 Milvus + bge-m3 构建语义企业知识库本文介绍了如何利用 Milvus 向量数据库和 bge-m3 嵌入模型构建比传统 ES 更懂语义的企业知识库系统。文章首先分析了 ES 关键词检索在口语化查询场景下的结构性缺陷，指出向量检索通过语义相似度匹配能有效解决"用户提问与文档术语不匹配"的问题。重点讲解了 bge-m3 模型的特点（支持稠密、稀疏和多向量三种检索模式）和

#milvus #elasticsearch #java

《Agentx专栏》04-工具系统：从@Tool注解到MCP协议，构建企业级Agent工具体系

本文深入解析了AgentX企业级工具体系的设计与实现，涵盖两种工具接入方式（@Tool注解和McpTool接口）及其适用场景。文章详细拆解了ToolRegistry的核心机制，包括自动扫描、去重保护、类型安全反射调用等关键技术点，并分享了工具描述编写对LLM决策质量的影响。通过天气工具和风控工具等实战案例，展示了生产级工具的实现细节，同时揭示了ForkJoinPool、工具命名重复等三大实战坑点。

#人工智能 #java #后端 +1

《Agentx专栏》02-技术选型：预算有限时如何做出正确的技术决策

本文分享了在有限资源条件下构建AI智能体平台AgentX的技术选型经验。作者基于3台低配云服务器(2C4G)和300元/月的预算约束，详细阐述了6个关键决策：选择LangChain4j而非Spring AI作为AI编排框架，因其更完善的Agent/Tool支持采用混合推理架构：本地CPU运行qwen2.5模型处理非实时任务，云端API处理高优先级请求选用高性能但部署复杂的Milvus作为向量

#java #架构 #spring +1

《Agentx专栏》02-技术选型：预算有限时如何做出正确的技术决策

#java #架构 #spring +1

《AgentX 专栏》01-前言：一个Java开发者的Agent实践之路

AgentX 是我在业余时间，反复打磨出来的东西。一个普通的 Java 开发者，在不依赖大厂资源的情况下，能把企业级 AI 系统做到什么程度？答案我还在找。欢迎你一起。

#java #人工智能 #spring boot +1

《Spring AI + 大模型全栈实战》学习手册系列 · Spring AI + DeepSeek 企业级全栈落地与极限调优指南

【万字专栏】Spring AI + DeepSeek 企业级全栈落地指南摘要：本文由资深全栈架构师分享基于Spring AI和国产大模型DeepSeek的企业级AI应用实战经验。文章涵盖：1) Spring AI 2.x架构演进，支持Java 21虚拟线程和Redis智能记忆引擎；2) 项目初始化避坑指南，包括Maven配置和DeepSeek专属接入方案；3) 核心功能实现，如流式响应(SSE)

#人工智能 #spring #java +2

Docker Compose 容器管理与自动化部署进阶指南

这份文档不仅包含基础配置，还整合了以及等实战干货。

#docker #自动化 #容器

《Spring AI + 大模型全栈实战》学习手册系列 · 专题八：《RAG 系统安全与权限管理：企业级数据保护方案》

1.2 安全架构分层设计1.3 安全合规要求对照表合规标准适用场景核心要求RAG 系统对应措施等保 2.0中国政府/国企三级等保身份认证、访问控制、审计日志GDPR欧盟用户数据数据保护数据脱敏、删除权、可携带权ISO 27001国际企业信息安全安全策略、风险评估、持续改进SOC 2SaaS 服务信任服务可用性、保密性、隐私保护个人信息保护法中国用户数据隐私保护最小化收集、知情同意、安全存储第 2

#spring #人工智能 #spring boot +4

共 38 条

请选择