logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《Spring AI + 大模型全栈实战》学习手册系列 · 专题四:《Ollama 模型管理与调优:让 AI 模型在低配服务器上流畅运行》

Ollama 模型管理与优化指南 Ollama 是一个开源的本地大语言模型运行平台,专为简化 LLM 部署而设计。它具有一键部署、模型量化、REST API 等核心特性,能在低配服务器上高效运行。 主要优势: 部署简单:30秒完成安装 自动量化:内存占用降低50-75% 标准API:集成效率提升80% 流式输出:首字延迟<500ms 安装方式支持Linux脚本和Docker容器化部署,并提供

#spring#人工智能#学习
《Spring AI + 大模型全栈实战》学习手册系列 · Spring AI + DeepSeek 企业级全栈落地与极限调优指南

【万字专栏】Spring AI + DeepSeek 企业级全栈落地指南 摘要:本文由资深全栈架构师分享基于Spring AI和国产大模型DeepSeek的企业级AI应用实战经验。文章涵盖:1) Spring AI 2.x架构演进,支持Java 21虚拟线程和Redis智能记忆引擎;2) 项目初始化避坑指南,包括Maven配置和DeepSeek专属接入方案;3) 核心功能实现,如流式响应(SSE)

文章图片
#人工智能#spring#java +2
《AgentX 专栏》09-MCP协议双向打通:让AgentX既能被Claude调用又能调度全球工具生态

本文介绍了AgentX如何通过MCP协议实现AI工具生态的双向互通,主要包含以下要点: 问题背景:传统AI工具生态存在"信息孤岛"问题,N个工具与M个客户端需要N×M套对接代码,对接成本高昂。 MCP协议作用:作为AI工具生态的统一标准协议,MCP将对接复杂度从N×M降至N+M,类似"AI世界的USB-C接口"。 AgentX的双向设计: 作为MCP Server:将内部Java工具(@Tool注

文章图片
#人工智能#java#后端 +1
《AgentX 专栏》10-生产部署:3台2C4G云服务器把企业级Agent真正跑起来的完整方案

问题解决手段怎么保证哪台机器都能跑?容器化(Docker)—— 把运行环境打包进镜像多个依赖组件怎么协同?编排(docker compose)—— 一份配置拉起所有服务挂了怎么办?健康检查 + 自动重启 + 监控告警设计决策解决什么问题三节点拓扑(推理/存储/监控)三类负载资源特征不同,分开互不抢资源Docker 多阶段构建编译/运行分离,镜像从 800MB 瘦到 200MBOllama/Redi

文章图片
#服务器#运维#milvus +2
《AgentX 专栏》09-MCP协议双向打通:让AgentX既能被Claude调用又能调度全球工具生态

本文介绍了AgentX如何通过MCP协议实现AI工具生态的双向互通,主要包含以下要点: 问题背景:传统AI工具生态存在"信息孤岛"问题,N个工具与M个客户端需要N×M套对接代码,对接成本高昂。 MCP协议作用:作为AI工具生态的统一标准协议,MCP将对接复杂度从N×M降至N+M,类似"AI世界的USB-C接口"。 AgentX的双向设计: 作为MCP Server:将内部Java工具(@Tool注

文章图片
#人工智能#java#后端 +1
《AgentX 专栏》09-MCP协议双向打通:让AgentX既能被Claude调用又能调度全球工具生态

本文介绍了AgentX如何通过MCP协议实现AI工具生态的双向互通,主要包含以下要点: 问题背景:传统AI工具生态存在"信息孤岛"问题,N个工具与M个客户端需要N×M套对接代码,对接成本高昂。 MCP协议作用:作为AI工具生态的统一标准协议,MCP将对接复杂度从N×M降至N+M,类似"AI世界的USB-C接口"。 AgentX的双向设计: 作为MCP Server:将内部Java工具(@Tool注

文章图片
#人工智能#java#后端 +1
《AgentX 专栏》08-工作流引擎:AgentWorkflow怎么把工具记忆流程串成一条流水线

本文介绍了AgentX工作流引擎的设计思路和实现方案,重点解决如何将工具、记忆和流程高效整合的问题。文章首先指出缺乏工作流引擎的Agent系统会陷入复杂的if-else嵌套,导致维护困难。随后提出工作流引擎的核心定义,并对比了LangGraph、AutoGen等主流框架。 AgentX采用双档分流设计,针对简单任务使用AiService直驱模式,复杂任务则采用LangGraph三节点循环(检索、A

文章图片
#架构#java
《AgentX 专栏》08-工作流引擎:AgentWorkflow怎么把工具记忆流程串成一条流水线

本文介绍了AgentX工作流引擎的设计思路和实现方案,重点解决如何将工具、记忆和流程高效整合的问题。文章首先指出缺乏工作流引擎的Agent系统会陷入复杂的if-else嵌套,导致维护困难。随后提出工作流引擎的核心定义,并对比了LangGraph、AutoGen等主流框架。 AgentX采用双档分流设计,针对简单任务使用AiService直驱模式,复杂任务则采用LangGraph三节点循环(检索、A

文章图片
#架构#java
《AgentX 专栏》07-全链路可观测:用OpenTelemetry+Jaeger让每次AI对话都可追踪可复盘

本文将介绍如何利用 OpenTelemetry和Jaeger实现AI对话系统的全链路可观测性,通过追踪每次LLM对话的执行过程,将"黑盒"操作可视化。主要内容包括: 问题背景:传统日志难以定位AI系统中"消失的50秒"问题,无法分析LLM思考、工具调用等环节的耗时情况。 解决方案:采用OpenTelemetry+Jaeger构建三层监控体系: HTTP自动埋点记录请求全生命周期 业务手动埋点标记关

文章图片
#人工智能#java#架构 +1
《AgentX 专栏》07-全链路可观测:用OpenTelemetry+Jaeger让每次AI对话都可追踪可复盘

本文将介绍如何利用 OpenTelemetry和Jaeger实现AI对话系统的全链路可观测性,通过追踪每次LLM对话的执行过程,将"黑盒"操作可视化。主要内容包括: 问题背景:传统日志难以定位AI系统中"消失的50秒"问题,无法分析LLM思考、工具调用等环节的耗时情况。 解决方案:采用OpenTelemetry+Jaeger构建三层监控体系: HTTP自动埋点记录请求全生命周期 业务手动埋点标记关

文章图片
#人工智能#java#架构 +1
    共 49 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择