logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型参数高效微调PEFT

本文全面详细讲述了大模型PEFT的发展路线、主要算法的原理,并基于Hugging Face库实现了通用大模型的LoRA微调流程。

#nlp#人工智能
大模型全量指令微调——Full Parameter SFT

本文介绍了预训练好自己的大语言模型后如何微调,激发模型的对话能力,并讨论了如何调用trl库进行预训练。

#人工智能#nlp
推理加速KV Cache与显存优化

简单介绍了一下KV Cache的原理以及推理框架vLLM的PagedAttention机制对显存的优化方法。

#人工智能
虚拟机Ubuntu基本配置(远程连接以及C/C++环境)

ubuntu的最基本配置都在这里:远程连接、vim格式配置、命令框优化

文章图片
#ubuntu#linux
到底了