
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了AgentX技术专栏中的双层记忆架构设计,通过Redis实现短期记忆存储和Milvus实现长期记忆存储,解决LLM无状态问题。Redis存储最近20轮对话,24小时TTL自动过期,保证多实例一致性;Milvus存储语义化知识片段,支持RAG检索。文章详细解析了RedisMemoryStore的实现、Fallback机制保障高可用,以及如何与LangChain4j集成。同时总结了序列化、m

本文介绍了AgentX技术专栏中的双层记忆架构设计,通过Redis实现短期记忆存储和Milvus实现长期记忆存储,解决LLM无状态问题。Redis存储最近20轮对话,24小时TTL自动过期,保证多实例一致性;Milvus存储语义化知识片段,支持RAG检索。文章详细解析了RedisMemoryStore的实现、Fallback机制保障高可用,以及如何与LangChain4j集成。同时总结了序列化、m

RAG 进阶:用 Milvus + bge-m3 构建语义企业知识库 本文介绍了如何利用 Milvus 向量数据库和 bge-m3 嵌入模型构建比传统 ES 更懂语义的企业知识库系统。文章首先分析了 ES 关键词检索在口语化查询场景下的结构性缺陷,指出向量检索通过语义相似度匹配能有效解决"用户提问与文档术语不匹配"的问题。重点讲解了 bge-m3 模型的特点(支持稠密、稀疏和多向量三种检索模式)和

本文深入解析了AgentX企业级工具体系的设计与实现,涵盖两种工具接入方式(@Tool注解和McpTool接口)及其适用场景。文章详细拆解了ToolRegistry的核心机制,包括自动扫描、去重保护、类型安全反射调用等关键技术点,并分享了工具描述编写对LLM决策质量的影响。通过天气工具和风控工具等实战案例,展示了生产级工具的实现细节,同时揭示了ForkJoinPool、工具命名重复等三大实战坑点。

本文分享了在有限资源条件下构建AI智能体平台AgentX的技术选型经验。作者基于3台低配云服务器(2C4G)和300元/月的预算约束,详细阐述了6个关键决策: 选择LangChain4j而非Spring AI作为AI编排框架,因其更完善的Agent/Tool支持 采用混合推理架构:本地CPU运行qwen2.5模型处理非实时任务,云端API处理高优先级请求 选用高性能但部署复杂的Milvus作为向量

本文分享了在有限资源条件下构建AI智能体平台AgentX的技术选型经验。作者基于3台低配云服务器(2C4G)和300元/月的预算约束,详细阐述了6个关键决策: 选择LangChain4j而非Spring AI作为AI编排框架,因其更完善的Agent/Tool支持 采用混合推理架构:本地CPU运行qwen2.5模型处理非实时任务,云端API处理高优先级请求 选用高性能但部署复杂的Milvus作为向量

AgentX 是我在业余时间,反复打磨出来的东西。一个普通的 Java 开发者,在不依赖大厂资源的情况下,能把企业级 AI 系统做到什么程度?答案我还在找。欢迎你一起。

【万字专栏】Spring AI + DeepSeek 企业级全栈落地指南 摘要:本文由资深全栈架构师分享基于Spring AI和国产大模型DeepSeek的企业级AI应用实战经验。文章涵盖:1) Spring AI 2.x架构演进,支持Java 21虚拟线程和Redis智能记忆引擎;2) 项目初始化避坑指南,包括Maven配置和DeepSeek专属接入方案;3) 核心功能实现,如流式响应(SSE)

这份文档不仅包含基础配置,还整合了以及等实战干货。
1.2 安全架构分层设计1.3 安全合规要求对照表合规标准适用场景核心要求RAG 系统对应措施等保 2.0中国政府/国企三级等保身份认证、访问控制、审计日志GDPR欧盟用户数据数据保护数据脱敏、删除权、可携带权ISO 27001国际企业信息安全安全策略、风险评估、持续改进SOC 2SaaS 服务信任服务可用性、保密性、隐私保护个人信息保护法中国用户数据隐私保护最小化收集、知情同意、安全存储第 2







