logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于QWEN3、3.5训练Lora

在做很多分类任务时,实际项目中的情况很多而且复杂,不可能将每种示例都放入到提示词中,同时为了让模型能更好的做任务,所以使用Lora。结论是很不错,在一定程度上也节省了一些tokenTIP:不同架构的和参数的模型不能共用一个Lora,哪怕是同一系列(我尝试了不同平台:A100->p800,A100 3.5B->A100 122B)

#人工智能#深度学习
VLLM-0.20.1中文配置参数

本文介绍 vLLM 0.20.1 版本更新:架构层面重构 CLI、Engine 调度器与多模态体系;新增 DeepSeekV4、Qwen3、Gemma3 等模型支持;深度优化 CUDA、FlashInfer、FP8、MLA 及 MoE 性能。详解了 JSON CLI、模型配置、并行配置等核心参数,给出生产部署示例及 API 密钥、内存优化、日志控制等安全调优建议,适合大规模模型部署

#python#人工智能
VLLM-0.20.1中文配置参数

本文介绍 vLLM 0.20.1 版本更新:架构层面重构 CLI、Engine 调度器与多模态体系;新增 DeepSeekV4、Qwen3、Gemma3 等模型支持;深度优化 CUDA、FlashInfer、FP8、MLA 及 MoE 性能。详解了 JSON CLI、模型配置、并行配置等核心参数,给出生产部署示例及 API 密钥、内存优化、日志控制等安全调优建议,适合大规模模型部署

#python#人工智能
vllm多卡部署开源模型(二)

继续上一篇【先说一下使用时的一些问题,我截取了一些并发响应。

#pytorch#python#AIGC
vllm多卡部署开源模型(一)

背景:最近准备私有化一个语言模型,在问题理解,意图分析,数据组合等业务上,进行更好的理解,记录一下过程。【未完待续,吃饭中。4. embedding模型。5. rerank模型。

文章图片
#python#AIGC
vllm多卡部署开源模型(二)

继续上一篇【先说一下使用时的一些问题,我截取了一些并发响应。

#pytorch#python#AIGC
vllm多卡部署开源模型(一)

背景:最近准备私有化一个语言模型,在问题理解,意图分析,数据组合等业务上,进行更好的理解,记录一下过程。【未完待续,吃饭中。4. embedding模型。5. rerank模型。

文章图片
#python#AIGC
langchain对neo4j的使用

通过langchain组件生成图谱。本文是延续上一篇文章【】以下所有路径,命令都是基于这篇内容设置的。

#neo4j
langchain对neo4j的使用

通过langchain组件生成图谱。本文是延续上一篇文章【】以下所有路径,命令都是基于这篇内容设置的。

#neo4j
    共 11 条
  • 1
  • 2
  • 请选择