
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
—— 从原理到生产落地的完整技术手册 (2026 版)技术栈:Spring Boot 3.4 + Spring AI 1.0 + Milvus 2.6 + Ollama场景:阿里云低配 ECS 极限部署 / 标准企业级 GPU 集群部署这是一本面向生产环境的 RAG(检索增强生成)系统完整实施指南。不同于市面上偏重理论的 AI 教程,本书从第一行代码到生产运维,提供可落地、可复制、可优化的全栈解决
RAG(检索增强生成)技术解析与应用指南 本文系统介绍了RAG技术的核心原理与架构设计,包含以下关键内容: 技术原理:RAG通过向量检索(Embedding模型)从知识库获取相关信息,再结合大语言模型(LLM)生成精准回答,解决了传统AI的"幻觉"问题。 核心组件: 向量数据库(如Milvus)实现语义检索 大模型(如Qwen)负责内容生成 前端展示层实现流式输出 应用场景:包
Ollama 模型管理与优化指南 Ollama 是一个开源的本地大语言模型运行平台,专为简化 LLM 部署而设计。它具有一键部署、模型量化、REST API 等核心特性,能在低配服务器上高效运行。 主要优势: 部署简单:30秒完成安装 自动量化:内存占用降低50-75% 标准API:集成效率提升80% 流式输出:首字延迟<500ms 安装方式支持Linux脚本和Docker容器化部署,并提供
《Spring AI + 大模型全栈实战》学习手册摘要 本手册是为开发者打造的AI全栈实战指南,系统讲解如何基于Spring AI构建企业级RAG智能问答系统。内容涵盖9大专题,从Spring AI核心概念到生产环境部署,包含: 核心知识点:向量数据库、Prompt工程、安全权限等 完整代码示例:Spring Boot+Vue3+Milvus+Ollama技术栈 工程实践:性能调优、运维监控、故障

本文介绍了企业级RAG智能问答系统的Docker Compose容器化部署方案。系统采用分层架构设计,包含前端层(Vue3+Nginx)、网关层(Spring Boot)、服务层(Ollama大模型、Milvus向量库、Redis、MySQL、MinIO)和监控层(Prometheus、Grafana、ELK)。详细展示了docker-compose.yml配置文件,涵盖各服务的关键配置参数,包括
2026 AI Agent 浪潮:Windows本地部署OpenClaw指南 本文详细介绍了在Windows系统上部署开源AI智能体框架OpenClaw的完整流程。主要内容包括: 环境准备:需Node.js v22+、Git及DeepSeek API Key 基础安装:提供PowerShell一键安装脚本及初始化命令 关键配置: 切换本地模式避免连接问题 正确设置网关令牌路径(gateway.au
RAG 进阶:用 Milvus + bge-m3 构建语义企业知识库 本文介绍了如何利用 Milvus 向量数据库和 bge-m3 嵌入模型构建比传统 ES 更懂语义的企业知识库系统。文章首先分析了 ES 关键词检索在口语化查询场景下的结构性缺陷,指出向量检索通过语义相似度匹配能有效解决"用户提问与文档术语不匹配"的问题。重点讲解了 bge-m3 模型的特点(支持稠密、稀疏和多向量三种检索模式)和

本文介绍了AgentX如何通过MCP协议实现AI工具生态的双向互通,主要包含以下要点: 问题背景:传统AI工具生态存在"信息孤岛"问题,N个工具与M个客户端需要N×M套对接代码,对接成本高昂。 MCP协议作用:作为AI工具生态的统一标准协议,MCP将对接复杂度从N×M降至N+M,类似"AI世界的USB-C接口"。 AgentX的双向设计: 作为MCP Server:将内部Java工具(@Tool注

问题解决手段怎么保证哪台机器都能跑?容器化(Docker)—— 把运行环境打包进镜像多个依赖组件怎么协同?编排(docker compose)—— 一份配置拉起所有服务挂了怎么办?健康检查 + 自动重启 + 监控告警设计决策解决什么问题三节点拓扑(推理/存储/监控)三类负载资源特征不同,分开互不抢资源Docker 多阶段构建编译/运行分离,镜像从 800MB 瘦到 200MBOllama/Redi

我是一名写了 12 年代码的后端老兵,做过研发经理,带过团队,扛过日均百万级请求的系统,也在金融、政务领域趟过不少浑水。这些年,我见过太多技术潮起潮落。但 AI 这一波,明显不一样——它不是又一个框架的更替,而是软件开发方式本身的换挡。说实话,面对它,我也焦虑过。成了一个只会「调 API 拼 Demo」的人——看着热闹,真要落地却什么都证明不了。用我最熟的 Java,从 0 手撸了一套企业级 Ag








