
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
大模型参数高效微调PEFT
本文全面详细讲述了大模型PEFT的发展路线、主要算法的原理,并基于Hugging Face库实现了通用大模型的LoRA微调流程。
大模型全量指令微调——Full Parameter SFT
本文介绍了预训练好自己的大语言模型后如何微调,激发模型的对话能力,并讨论了如何调用trl库进行预训练。
推理加速KV Cache与显存优化
简单介绍了一下KV Cache的原理以及推理框架vLLM的PagedAttention机制对显存的优化方法。
虚拟机Ubuntu基本配置(远程连接以及C/C++环境)
ubuntu的最基本配置都在这里:远程连接、vim格式配置、命令框优化

到底了







