logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

vLLM在RTX50系显卡上部署大模型-使用wsl2

针对vLLM框架对RTX50系显卡支持不足的问题,本文提供手动编译解决方案。步骤包括:1)在WSL上配置Ubuntu环境;2)通过pipx安装uv工具管理Python环境;3)手动编译vLLM,需特别注意PyTorch和CUDA版本的兼容性(推荐CUDA 12.8);4)安装Qwen3模型时需匹配CUDA版本。该方法可作为官方支持前的临时方案,非50系显卡用户可直接按官方文档安装。环境配置需严格验

文章图片
#人工智能#语言模型#linux +1
SpringBoot整合LangChain4j实现RAG (检索增强生成)

本文介绍了使用langchain4j,整合SpringBoot开发RAG应用的方法。

文章图片
#java#全文检索#人工智能 +2
SpringBoot整合AI应用-流式对话 (使用langchain4j)

本文介绍了使用SpringBoot整合大语言模型进行流式对话的方法

文章图片
#spring boot#java#人工智能 +2
SpringAI 整合MCP实现联网搜索 (基于tavily)

摘要: 本文介绍了如何使用SpringAI框架集成Tavily搜索服务,通过MCP(模型上下文协议)实现联网搜索功能。内容包括:1) MCP协议简介及其作用;2) 开发准备工作,包括获取Tavily API Key;3) 搭建MCP服务器端的详细步骤,包括依赖引入、配置文件和SSE控制器实现;4) 项目代码结构说明。文章属于作者AI应用学习笔记系列,提供了完整项目地址和相关基础知识要求,适合具备J

文章图片
#java#后端#intellij-idea +3
SpringBoot 整合SpringAI实现简单的RAG (检索增强生成)

本文介绍了如何使用SpringAI框架构建RAG(检索增强生成)系统。主要内容包括: 环境准备: 要求JDK17+,推荐JDK21 使用Docker安装Elasticsearch 8.15.5作为向量数据库 提供了docker-compose配置文件示例 技术整合: 引入SpringAI相关依赖,包括OpenAI组件和Elasticsearch集成 配置Elasticsearch Java客户端

文章图片
#人工智能#java
vLLM在RTX50系显卡上部署大模型-使用wsl2

针对vLLM框架对RTX50系显卡支持不足的问题,本文提供手动编译解决方案。步骤包括:1)在WSL上配置Ubuntu环境;2)通过pipx安装uv工具管理Python环境;3)手动编译vLLM,需特别注意PyTorch和CUDA版本的兼容性(推荐CUDA 12.8);4)安装Qwen3模型时需匹配CUDA版本。该方法可作为官方支持前的临时方案,非50系显卡用户可直接按官方文档安装。环境配置需严格验

文章图片
#人工智能#语言模型#linux +1
EasyExcel读取多层嵌套表头数据

本文介绍使用EasyExcel处理多层表头Excel文件时遇到的问题及解决方案。对于合并列的多层嵌套表头,直接通过表头名称映射可能导致数据丢失,建议改用headRowNumber+index方式读取。文中给出实体类注解示例,并封装工具类ExcelImportUtil,支持通过MultipartFile或本地File读取Excel,灵活适应不同表头行数,同时可在数据读取时进行额外处理(如日期拆分)。

文章图片
#java#intellij-idea#后端 +1
到底了