登录社区云,与社区用户共同成长
邀请您加入社区
其实像 RAG、Tool Calling、MCP、向量数据库、多模型适配这些能力,在 Spring AI 1.x 后期已经比较成熟了,而 2.0 更大的变化,可能是开始强化工程化和 Agent 体系。不是我吹,2026 年的今天,如果你还没有接触过 Spring AI,还没有在项目中使用过 Spring AI 落地,那你可能就真的落伍了。不管你是 AI 初学者,还是有经验的开发者,AI、Agent
本文介绍了大模型的核心概念和应用,包括大模型预训练、微调、幻觉、MCP协议、Token、RAG-检索增强生成、记忆模块、Skill、ReAct、Agent的自我反思、Harness工程和SDD-规格驱动开发等。通过这些基础知识,小白程序员可以快速了解大模型的工作原理,掌握AI Agent开发的核心技能,为今后的职业发展打下坚实基础。
千呼万唤,历经 8 个里程碑版本,2 个候选版本,Spring AI 2.0.0 正式版本终于发布了:从去年开始,Spring AI 的发展速度可以说非常快。从最初提供统一的模型调用接口,到后来陆续加入等能力,Spring AI 已经逐渐成为 Java 生态中最受关注的 AI 开发框架之一。。所以,Spring AI 2.0 并不是一次简单的版本升级,而是一次面向未来 Agent 开发体系的全面重
MCP = Model Context Protocol(模型上下文协议)在// 1. 定义工具常量"hello-say-hello", // 工具名称"Say hello to someone", // 工具描述// 参数结构// 2. 定义参数结构// 数据类型是对象// 定义参数"name",Map.of("type", "string", // 参数类型:字符串"description",
本文通过6个典型业务场景对比了Claude API和OpenAI API的成本差异,并提供了优化策略。核心发现:1)不同任务类型的输入输出token比例差异显著,成本结构需具体分析;2)轻量级模型在客服、摘要等场景性价比更高;3)RAG和Agent场景通过优化检索管道和上下文管理可大幅降本;4)需综合考虑成功率、重试等隐性成本。文章建议:优先优化工程实现(如Prompt缓存、检索压缩),再评估模型
优势说明与 Spring Boot 深度集成遵循 Spring 开发者熟悉的配置和开发习惯模型切换零成本统一 API,改配置即可切换不同模型企业级特性完备支持事务、安全、监控等 Spring 生态能力模块化设计按需引入功能模块,避免依赖臃肿官方文档完善Spring 团队持续维护,1.0 GA 后稳定可靠MCP 原生支持1.1 起整合 Model Context Protocol,连接外部工具生态A
在渔业生产中,海产品晾晒是保障产品质量与存储的重要环节。然而,传统海产品晾晒方式多依赖人工经验判断环境条件,缺乏精准的环境监测与自动化控制手段,导致晾晒效果不稳定,易受天气突变影响,造成产品损失。为解决这些问题,结合物联网、传感器等技术的发展趋势,开展海产品晾晒控制系统的研究与设计工作。海产品晾晒控制系统;物联网;MQTT1.1 研究背景。
相较于网页端、命令行版本,桌面端提供可视化操作、内置终端编辑器、多会话并行隔离、本地项目无缝挂载能力,无需配置复杂环境,可完全替代多款 AI 工具,适配开发者、办公人员全场景使用。原生集成终端、代码编辑器、可视化 Diff 对比、应用预览能力,无需切换 IDE、终端、浏览器,可直接完成代码修改、命令执行、效果预览、PR 审查全流程操作。支持桌面一键截图上传,自动识别报错日志、页面 BUG、图表数据
本文介绍了Spring AI中MCP服务端注解的使用方法,主要包括:**@McpTool**:标记方法为工具,支持参数描述、JSON Schema生成、进度追踪和请求上下文访问。**@McpResource**:通过URI模板提供资源访问,支持MIME类型和元数据配置。**@McpPrompt**:生成AI交互提示消息,支持必选和可选参数。**@McpComplete**:为提示参数或资源URI提
本文介绍了Spring AI中MCP客户端注解的声明式用法,包括@McpLogging、@McpSampling、@McpElicitation、@McpProgress、@McpToolListChanged、@McpResourceListChanged和@McpPromptListChanged。所有注解必须通过clients参数关联特定MCP连接。处理器支持同步和异步实现,在Spring
本文详细阐述了全域智能营销决策平台(Uni-MDP)的技术选型过程,重点分析了Spring AI、OpenClaw、Hermes和Harness四个核心组件的选型逻辑。文章首先回顾了Uni-MDP六层三纵的总体架构及各层技术诉求,指出算法层与中台层的衔接是核心挑战。随后深入解析了Spring AI作为"AI能力的Spring化抽象"的定位价值,特别是其2025年模块化重构后的轻量化优势。最后展示了
本文记录了AlphaLens开发第三周的关键转折:从功能堆砌转向精准定位。作者主动砍掉行情、K线等传统股票功能,将产品重新定义为"快速理解上市公司的AI工具",聚焦核心价值。主要进展包括:完成股票详情页MVP、接入DeepSeek模型、重点优化Prompt(摒弃AI套话,输出直白分析)。最大的认知转变是意识到"做减法比加法更难但更重要",决定放弃做"
后端模块后端springBoot +springAi 链接: https://pan.baidu.com/s/1Woio0RVgxLSVvbulhA9rxA?pwd=1234 提取码: 1234。
Spring AI是Spring官方推出的AI开发框架,让Java开发者可以用熟悉的Spring Boot风格构建AI应用。2026年全面拥抱Agent工程后,Spring AI已成为Java开发者切入AI后端开发的最佳入口。本文系统介绍Spring AI的核心能力:统一模型抽象(OpenAI/通义千问/Claude等)、标准化API(ChatClient/EmbeddingModel)、Tool
这篇面向想用 AI 提升研发效率的开发者和技术负责人,但不会把“Codex 实战:团队协作中的使用边界”写成概念清单。我会按真实项目落地教程的思路,把它放到真实开发、学习路线和求职准备里看,顺便讲几个容易忽略的取舍。这次我会从“从一次真实项目复盘切入,重点写取舍和踩坑”展开,换一组场景和例子来讲。回到“Codex 实战:团队协作中的使用边界”这个主题,最重要的不是把名词背全,而是知道它该放在什么场
Claude Code 的三层compact机制,本质上是在回答一个朴素问题:长程 Agent 任务里,哪些历史必须留下,哪些只是在占地方?用模型摘要兜底,能力强,但贵且不稳定。用本地 notes 承接中等压力,避免过早进入高成本路径。最不起眼,却跑得最频繁:每次请求前都扫一遍旧工具结果,能用就走服务端缓存编辑,cache 已经过期就直接本地瘦身。这套设计最聪明的地方,不是“压缩得多”,而是把不同
果想用国内LLM或者其他中转的LLM,通常是兼容OpenAI的模式,但是OpenAI这里配置是写死的,无法自定义baseurl:如果想直接通过vLLM配置,默认无法指定api key:看来默认就无法使用其他LLM了?已跟PM反馈过此问题,回复后续版本会考虑支持这个OpenAI兼容的LLM配置。但是目前有没有workaround呢?实际测试,通过Nginx配置结合vLLM的入口,可以实现连通国内LL
在 Codex CLI 里切模型,不想每次改配置文件。项目从发布到现在迭代了 16 个提交,该修的 bug 都修了,该补的功能也补了。如果你也是 Codex CLI 的用户,花 5 分钟。
Agent 跑工具调用经常一轮接一轮,要是只把最终回答推给前端,用户那边就是十几秒甚至几十秒的空白,体验很差,出问题也没法排查。我们的做法是把整个工具调用循环里发生的事情都拆成事件吐到 SSE 流里——token 在出、思考在写、工具被调了、工具返回了什么,前端按事件类型渲染就行。记忆解决了"它记得",但 Agent 还差一块——"它能在你不在的时候干活"。JobRunr 要把这条 lambda
在本项目教程中,我们曾经提到过部署 MCP 服务可以使用 Serverless。使用 Serverless 平台,开发者只需关注业务代码的编写,无需管理服务器等基础设施,系统会根据实际使用量自动扩容并按使用付费,从而显著降低运维成本和开发复杂度。因此,Serverless 很适合业务规模不确定的、流量波动大的场景,也很适合我们学习时快速部署一些小型项目,不用买服务器、不用的时候
MCP(Model Context Protocol,模型上下文协议)是一种开放标准,目的是增强 AI 与外部系统的交互能力。MCP 为 AI 提供了与外部工具、资源和服务交互的标准化方式,让 AI 能够访问最新数据、执行复杂操作,并与现有系统集成。根据官方定义,MCP 是一种开放协议,它标准化了应用程序如何向大模型提供上下文的方式。可以将 MCP 想象成 AI 应用的 USB 接口。
Spring AI API提供跨AI提供商的可移植模型接口,支持聊天、图像生成、音频转录、语音合成和嵌入等功能,兼顾同步与流式调用。其核心组件包括统一向量存储API、通过注解简化模型工具调用的Tool Calling API、类似WebClient的ChatClient流畅API,以及封装常见AI模式的Advisors API。此外,还提供MCP协议集成、Spring Boot自动配置和ETL数据
Spring AI MCP无状态服务端基于Streamable-HTTP,不维护会话状态,适合云原生部署。需设置`protocol=STATELESS`,支持WebMVC和WebFlux两种传输方式。它可自动将Spring Bean中的工具、资源、提示和补全能力注册为同步或异步MCP规范,并支持通过注解简化开发。关键配置包括服务端名称、版本、超时时间及自定义端点,工具回调支持按名称自动去重。
本文介绍了Spring AI对MCP(模型上下文协议)可流式HTTP传输的支持。该传输允许MCP服务器通过HTTP POST/GET和SSE处理多客户端连接,支持WebMVC和WebFlux两种实现。核心配置包括设置协议为STREAMABLE、定义服务器名称版本、启用禁用工具/资源/提示/补全四大能力,以及管理连接保活。服务器启动器自动将Spring Bean(如工具回调、资源、提示等)转换为MC
Spring AI 提供 MCP 服务器启动器,支持 STDIO、SSE WebMVC 和 SSE WebFlux 三种传输方式。服务器可暴露工具、资源、提示和补全能力,支持同步/异步模式,并具备日志、进度、保活等机制。通过注解或 Bean 注册自动转换功能,配置灵活,适用于命令行、桌面或 Web 应用。
大模型推理服务的部署是一个系统工程,涉及 GPU 资源管理、请求调度、弹性伸缩、模型预热等多个环节。核心目标是在有限的 GPU 资源下,最大化推理吞吐量,同时满足延迟 SLA。落地路线建议:第一步,选择合适的推理引擎(vLLM 或 TensorRT-LLM),在单机环境验证模型的推理性能和内存占用。第二步,构建推理网关,实现请求路由、限流和流式响应,这是推理服务对外提供 API 的基础。第三步,部
一个 Agent 应用从原型走向生产的过程中,调试能力和运行效率是两个最容易被低估却最终决定成败的因素。在开发阶段,单步执行和 print 语句或许能帮助我们定位问题,但当一个 Agent 同时服务于数百个用户、每一步推理都涉及多次模型调用和工具执行时,传统的调试手段就会迅速失效,你无法在服务器上打断点,也不可能逐行阅读成千上万条日志。
更重要的是,它不仅提供了 LLM 调用层,还构建了一套完整的 Agent 体系、RAG 管道、多 Agent 协作协议和智能体运行时引擎。Spring AI 目前支持 20+ 模型供应商,包括 OpenAI、Azure OpenAI、Anthropic、Google GenAI、Amazon Bedrock、Ollama、DeepSeek、Mistral AI、Groq 等,覆盖面目前是 Java
400 万个 tokens。Claude Sonnet 4.6,$3 输入 / $15 输出,保守估算下来将近 $26。不是说它贵,是突然意识到:这只是一周的编码量。如果是个认真用 AI 工具的工程师,每个月的消费可能超过一台云服务器。然后 2026 年 4 月 24 日,DeepSeek 发布了 V4,并在三天后(今天,4 月 27 日)宣布 V4-Pro 限时降价 75%。我把 Claude
spring
——spring
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net