MY_JVM 个人主页

@zhoudongfeng

MY_JVM

2022-11-27 19:50:45 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Hermes V0.17.0 源码二次开发

hermes 源码二次开发

#python

VLLM-0.7.2中文配置参数

参数对照针对vllm0.7.2版本做的中文翻译对照，参数由模型自动翻译，可能存在不准确情况，使用时仔细甄别，我只用了一部分参数。

#python #服务发现 #人工智能

VLLM-0.20.1中文配置参数

本文介绍 vLLM 0.20.1 版本更新：架构层面重构 CLI、Engine 调度器与多模态体系；新增 DeepSeekV4、Qwen3、Gemma3 等模型支持；深度优化 CUDA、FlashInfer、FP8、MLA 及 MoE 性能。详解了 JSON CLI、模型配置、并行配置等核心参数，给出生产部署示例及 API 密钥、内存优化、日志控制等安全调优建议，适合大规模模型部署

#python #人工智能

基于QWEN3、3.5训练Lora

在做很多分类任务时，实际项目中的情况很多而且复杂，不可能将每种示例都放入到提示词中，同时为了让模型能更好的做任务，所以使用Lora。结论是很不错，在一定程度上也节省了一些tokenTIP：不同架构的和参数的模型不能共用一个Lora，哪怕是同一系列（我尝试了不同平台：A100->p800，A100 3.5B->A100 122B）

#人工智能 #深度学习

AI落地--模型术语解释

大模型术语名词解释

#人工智能 #pytorch #python +1