logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Spring AI RetrievalAugmentationAdvisor

RetrievalAugmentationAdvisor(检索增强顾问)在Spring AI框架中扮演着重要角色,它主要用于增强AI模型的检索能力,通过结合外部知识库或数据源来提供更加丰富和准确的回答。

文章图片
#spring#人工智能#java
Nginx 代理Https服务

本文提供了Nginx代理转发HTTPS服务的详细配置指南,包括基本HTTPS代理配置、高级配置选项以及HTTP自动跳转HTTPS的设置。基本配置涉及SSL证书、优化参数和代理头设置,而高级配置则包括证书验证、WebSocket代理支持和负载均衡。此外,文章还介绍了如何通过Nginx代理HTTPS后端服务但对外提供HTTP访问的基础配置方案和关键配置说明。配置完成后,建议使用nginx -t测试配置

文章图片
#nginx#https#iphone
Spring AI Agent

Spring AI 的 Agent 是一种基于大语言模型的智能代理系统,具有动态决策、模块化设计和多代理协作三大特性。其核心功能包括:1)实时分析任务并动态规划执行流程;2)通过工具调用集成外部服务;3)支持多代理协同工作。实现模式涵盖单一LLM优化、链式工作流和工具调用等,适用于从简单分类到复杂协作的不同场景。典型应用包括天气查询、电商订单处理等,通过注解即可快速注册工具服务。该系统采用标准化协

文章图片
#spring#人工智能#java
【Spring AI MCP】Spring AI MCP学习目录

MCP(Model Context Protocol)是AI工程领域新兴的开放协议标准,旨在规范大语言模型与外部工具、知识库等能力的交互方式。该协议由多家AI平台共同推动,包含客户端、服务端、安全机制等完整技术架构。Spring AI框架对MCP提供了全面支持,包括流式HTTP通信、无状态交互、注解开发等特性,并通过系列技术文章详细解析了协议实现细节,涵盖从基础原理到安全认证等关键内容。

文章图片
#spring#人工智能#学习
AI Workflow

AI Workflow(人工智能工作流)指的是在构建、部署和管理AI模型与应用时所涉及的一系列步骤和流程。它将数据处理、模型训练、评估、部署及监控等环节有机结合起来,以实现高效、可重复的AI解决方案开发过程。

Spring AI VectorStoreChatMemoryAdvisor

VectorStoreChatMemoryAdvisor的主要功能是将聊天对话中的历史记录存储到向量数据库中,以便在后续对话中提供上下文记忆。这有助于模型更好地理解用户的意图,并生成更加连贯和相关的回复。

文章图片
#spring#人工智能#oracle
Spring AI 源码

Spring AI:构建AI应用的集成框架 Spring AI是一个基于Spring生态系统的AI工程框架,其核心目标是简化企业级AI应用开发。该框架通过模块化设计实现了以下关键能力: 模型集成:提供统一接口支持语言模型、嵌入模型等多种AI能力,屏蔽不同API的底层差异 向量处理:包含专门的向量存储模块,支持20+向量数据库的标准化操作 RAG流程:通过检索增强生成模块实现动态知识整合,解决大模型

文章图片
#spring#人工智能#原型模式
Spring AI RAG

检索增强生成(RAG)技术解析与应用 本文系统介绍了检索增强生成(RAG)技术的核心原理与实现方法。该技术通过将外部知识库实时检索结果融入生成过程,有效解决了传统大模型的"知识冻结"问题。RAG采用ETL流程处理非结构化数据,核心步骤包括文档智能分块、向量编码、相似检索和生成增强。 Spring AI提供了模块化实现方案,包含检索模块(VectorStoreDocumentRe

文章图片
#spring#人工智能#java
Spring AI 介绍

Spring AI 是 Spring 生态系统推出的面向人工智能工程的应用框架,旨在将 Spring 的设计原则(如可移植性、模块化)引入 AI 领域,为 Java 开发者提供便捷的 AI 集成方案。其核心特点包括生态融合、跨模型支持、提示工程、嵌入技术、Advisor 拦截器机制和检索增强生成(RAG)。Spring AI 通过标准化接口、模块化设计和快速集成,降低了 Java 开发者使用 AI

文章图片
#spring#人工智能#java
开源大模型生产环境部署方案(二) 基于Qwen

本文介绍了Qwen开源大模型在阿里云ModelScope生态下的生产环境部署方案。该方案采用Kubernetes集群和KServe推理服务,支持从Qwen-1.8B到Qwen-Max全系列模型的部署,重点优化了AWQ量化、vLLM推理适配和中文RAG流程。部署架构包含WAF防护、API网关、向量数据库和监控系统,针对Qwen模型的trust_remote_code、MoE支持和中文分词等特性进行了

文章图片
#开源
    共 74 条
  • 1
  • 2
  • 3
  • 8
  • 请选择