
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了使用LLaMA-Factory和vLLM工具进行大模型微调与部署的完整流程。主要内容包括:1)在AutoDL平台租用GPU并安装LLaMA-Factory环境;2)准备Qwen3-0.6B模型和关键词抽取任务数据集;3)通过WebUI界面配置LoRA微调参数;4)使用vLLM进行高效模型部署和服务调用。文中详细记录了从环境搭建到模型微调、权重导出和在线服务的每个步骤,并提供了常见问题排查
本文介绍了使用LLaMA-Factory和vLLM工具进行大模型微调与部署的完整流程。主要内容包括:1)在AutoDL平台租用GPU并安装LLaMA-Factory环境;2)准备Qwen3-0.6B模型和关键词抽取任务数据集;3)通过WebUI界面配置LoRA微调参数;4)使用vLLM进行高效模型部署和服务调用。文中详细记录了从环境搭建到模型微调、权重导出和在线服务的每个步骤,并提供了常见问题排查
摘要: "智能问数"系统是面向学校数据中台的AI查询助手,通过自然语言处理技术实现NL2SQL的完整闭环。系统基于FastAPI+LangGraph架构,集成通义千问大模型、Qdrant向量数据库和Elasticsearch搜索引擎,支持从自然语言问题自动生成并执行SQL查询。核心流程包括:关键词提取、多路召回(字段/指标/取值)、LLM语义过滤、SQL生成与校验、实时流式响应
本文档详细介绍了主Agent调用子Agent的架构设计方案。主要内容包括: 背景与目标:校园数据智能体需要主Agent作为统一入口调度多个垂直领域子Agent(如选课助手、校园通知等),主Agent负责意图识别和子Agent调用。 架构设计: 采用FastAPI+PostgreSQL技术栈 主Agent通过function_tool机制动态注册子Agent 全链路X-Request-Id实现请求追
摘要: "智能问数"系统是面向学校数据中台的AI查询助手,通过自然语言处理技术实现NL2SQL的完整闭环。系统基于FastAPI+LangGraph架构,集成通义千问大模型、Qdrant向量数据库和Elasticsearch搜索引擎,支持从自然语言问题自动生成并执行SQL查询。核心流程包括:关键词提取、多路召回(字段/指标/取值)、LLM语义过滤、SQL生成与校验、实时流式响应
摘要: "智能问数"系统是面向学校数据中台的AI查询助手,通过自然语言处理技术实现NL2SQL的完整闭环。系统基于FastAPI+LangGraph架构,集成通义千问大模型、Qdrant向量数据库和Elasticsearch搜索引擎,支持从自然语言问题自动生成并执行SQL查询。核心流程包括:关键词提取、多路召回(字段/指标/取值)、LLM语义过滤、SQL生成与校验、实时流式响应







