logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型微调实操入门

本文介绍了使用LLaMA-Factory和vLLM工具进行大模型微调与部署的完整流程。主要内容包括:1)在AutoDL平台租用GPU并安装LLaMA-Factory环境;2)准备Qwen3-0.6B模型和关键词抽取任务数据集;3)通过WebUI界面配置LoRA微调参数;4)使用vLLM进行高效模型部署和服务调用。文中详细记录了从环境搭建到模型微调、权重导出和在线服务的每个步骤,并提供了常见问题排查

#人工智能
大模型微调实操入门

本文介绍了使用LLaMA-Factory和vLLM工具进行大模型微调与部署的完整流程。主要内容包括:1)在AutoDL平台租用GPU并安装LLaMA-Factory环境;2)准备Qwen3-0.6B模型和关键词抽取任务数据集;3)通过WebUI界面配置LoRA微调参数;4)使用vLLM进行高效模型部署和服务调用。文中详细记录了从环境搭建到模型微调、权重导出和在线服务的每个步骤,并提供了常见问题排查

#人工智能
智能问数 —— 学校数据中台 AI 查询助手 技术方案设计文档

摘要: "智能问数"系统是面向学校数据中台的AI查询助手,通过自然语言处理技术实现NL2SQL的完整闭环。系统基于FastAPI+LangGraph架构,集成通义千问大模型、Qdrant向量数据库和Elasticsearch搜索引擎,支持从自然语言问题自动生成并执行SQL查询。核心流程包括:关键词提取、多路召回(字段/指标/取值)、LLM语义过滤、SQL生成与校验、实时流式响应

技术方案:主 Agent 调用子 Agent 架构设计

本文档详细介绍了主Agent调用子Agent的架构设计方案。主要内容包括: 背景与目标:校园数据智能体需要主Agent作为统一入口调度多个垂直领域子Agent(如选课助手、校园通知等),主Agent负责意图识别和子Agent调用。 架构设计: 采用FastAPI+PostgreSQL技术栈 主Agent通过function_tool机制动态注册子Agent 全链路X-Request-Id实现请求追

智能问数 —— 学校数据中台 AI 查询助手 技术方案设计文档

摘要: "智能问数"系统是面向学校数据中台的AI查询助手,通过自然语言处理技术实现NL2SQL的完整闭环。系统基于FastAPI+LangGraph架构,集成通义千问大模型、Qdrant向量数据库和Elasticsearch搜索引擎,支持从自然语言问题自动生成并执行SQL查询。核心流程包括:关键词提取、多路召回(字段/指标/取值)、LLM语义过滤、SQL生成与校验、实时流式响应

智能问数 —— 学校数据中台 AI 查询助手 技术方案设计文档

摘要: "智能问数"系统是面向学校数据中台的AI查询助手,通过自然语言处理技术实现NL2SQL的完整闭环。系统基于FastAPI+LangGraph架构,集成通义千问大模型、Qdrant向量数据库和Elasticsearch搜索引擎,支持从自然语言问题自动生成并执行SQL查询。核心流程包括:关键词提取、多路召回(字段/指标/取值)、LLM语义过滤、SQL生成与校验、实时流式响应

五、虚拟机栈

1、虚拟机栈概述虚拟机栈出现的背景由于跨平台性的设计, Java的指令都是根据栈来设计的。不同平台CPU架构不同,所以不能设计为基于寄存器的。优点是跨平台,指令集小,编译器容易实现,缺点是性能下降,实现同样的功能需要更多的指令。初步印象有不少Java开发人员一提到Java内存结构,就会非常粗粒度地将JVM中的内存区理解为仅有Java堆(heap)和Java栈(stack) ?为什么?内存中的栈与堆

#jvm
到底了