logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

(第四篇)Spring AI 实战进阶:Ollama+Spring AI 构建离线私有化 AI 服务(脱离 API 密钥的完整方案)

本文详细介绍了基于Ollama+SpringAI构建离线私有化AI服务的全流程解决方案。针对企业级开发中依赖API密钥、外网连接、数据安全等痛点,提出通过本地部署开源大模型实现完全离线运行的技术方案。内容包括:Ollama的安装配置与量化模型选择、SpringAI深度集成与自定义实现、模型优化与资源控制技巧、离线RAG知识库的部署方法,以及生产环境的高可用与监控方案。该方案特别适用于金融、政务等对

文章图片
#人工智能
深入浅出理解 AI Agent:从概念到本质,它为何不是普通聊天机器人?

AI Agent正从工具向智能伙伴进化,其核心特征包括自主性、主动性和持续性。与被动响应、短期记忆的普通聊天机器人不同,AI Agent能主动规划任务、长期记忆并实现闭环执行。它可连接外部系统处理复杂任务,如智能办公、个性化教育等。尽管面临环境适应、安全伦理等挑战,AI Agent作为自主决策的智能协作伙伴,代表着人工智能向通用智能发展的关键方向。

文章图片
#人工智能#机器人#AI
SpringCloud 进阶拓展:Spring Security OAuth2+JWT 微服务统一认证授权全实战|生产级方案 + 源码解析 + 踩坑实录

本文针对微服务架构下的认证授权核心痛点,深度拆解 Spring Security OAuth2+JWT 的底层原理,提供保姆级全流程实战教程,包含认证中心、资源服务器、网关统一鉴权的可直接复用源码,同时分享生产级优化方案、安全加固策略,以及一线生产环境踩过的 10 + 核心坑的完整解决方案,适合 Java 后端、微服务架构开发人员学习与项目落地参考。

文章图片
#spring#spring cloud#微服务
(第四篇)Spring AI 架构设计与优化:真实生产环境复盘,从 100ms 到 10ms 的响应提速全流程

本文基于 Spring AI 智能问答服务的真实生产环境优化案例,完整复盘从平均响应 100ms 优化到 10ms 的全流程。从 JProfiler 瓶颈定位、Milvus 向量检索索引优化、Spring AI 模型预热消除冷启动耗时,到语义级热点缓存设计,全程附可直接复用的代码、实测数据和踩坑实录,给 Java 开发者一套开箱即用的 Spring AI 性能落地方案。

文章图片
#人工智能#性能优化#RAG +1
(第三篇)Spring AI 架构设计与优化:容器化与云原生部署,基于 K8s 的 AI 应用全生命周期管理

本文针对 Spring AI 服务传统部署的环境不一致、扩容慢、发布风险高等核心痛点,详解基于 Docker+K8s 的云原生改造全流程。从 Docker 镜像极致优化、K8s 全资源部署、HPA 弹性伸缩,到 GitLab CI/CD 自动部署流水线落地,深度讲解 Spring Cloud Kubernetes 整合实践,附可直接复用的配置代码,给 Java 开发者一套开箱即用的 AI 服务云原

文章图片
#云原生
(第二篇)Spring AI 架构设计与优化:可观察性体系,打造全链路可视化的 AI 运维方案

本文针对 Spring AI 服务线上运维的核心痛点,详解全链路可视化的 AI 可观察性体系搭建方案。从 Micrometer 模型调用专属指标监控、Sleuth+Zipkin 全链路瓶颈定位、Prompt / 响应全量日志规范三大维度展开,覆盖生产环境代码实现、踩坑实录,附带可直接复用的 Grafana 监控模板与 PromQL 语句,为 Java 开发者提供可落地的 AI 服务运维方案。

文章图片
#人工智能#微服务
Vue 响应式原理深度解析:Vue2 vs Vue3 核心差异 + ref/reactive 实战指南

本文深入剖析Vue响应式系统原理,对比Vue2与Vue3实现差异。Vue2基于Object.defineProperty存在无法监听新增属性、数组操作受限等痛点;Vue3采用Proxy方案实现全面升级,支持对象/数组所有操作并提升性能。详细讲解了ref与reactive的使用场景与区别,提供toRefs等实用工具的使用指南,总结常见开发陷阱及解决方案。通过核心原理分析+实战示例,帮助开发者深入理解

文章图片
#vue.js#javascript#前端
(第六篇)Spring AI 基础入门之数据持久化:向量数据库集成入门

本文介绍了AI时代下向量数据库的关键作用与SpringAI的集成实践。主要内容包括:1. 向量数据库选型对比:分析Chroma(轻量级)和Milvus(企业级)的适用场景与核心特性;2. SpringAI统一接口:讲解VectorStore抽象接口及其增删改查方法;3. 实战演示:通过Docker部署Chroma,并使用SpringAI实现文本向量存储与语义检索的三步流程。文章提供了完整的代码示例

文章图片
#人工智能#数据库
(第一篇)Spring AI 架构设计与优化:从单实例到万级 QPS 分布式服务的演进之路

本文基于 Spring AI 生产环境实战经验,完整复盘从单实例服务到万级 QPS 分布式架构的全流程优化。针对 AI 服务高并发场景的核心痛点,深度拆解 @Async + 线程池异步批量处理、模型 / 向量 / 业务服务解耦、三级缓存架构设计等核心干货,配套完整的分布式服务拓扑与数据流详解,全程覆盖踩坑实录、参数调优、监控告警等落地细节,给 Java 开发者一套可直接复用的高并发 AI 服务落地

文章图片
#人工智能
(第六篇)Spring AI 核心技术攻坚:多模态模型集成与全场景落地实战

本文深入探讨SpringAI在多模态AI开发中的实践应用,系统讲解如何通过统一API设计快速集成DALL-E、StabilityAI、通义万相等主流图像模型,以及Whisper语音转录技术。文章详细剖析SpringAI的三层架构设计,提供从Prompt优化到参数调优的实战技巧,并完整实现"文本→图像→语音"端到端多模态内容生成平台。特别针对生产环境,给出API密钥管理、错误重试、限流熔断等关键优化

文章图片
#人工智能
    共 85 条
  • 1
  • 2
  • 3
  • 9
  • 请选择