戢鱗个人主页

戢鱗

2023-05-29 21:09:10 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

本文全面详细讲述了大模型PEFT的发展路线、主要算法的原理，并基于Hugging Face库实现了通用大模型的LoRA微调流程。

本文介绍了预训练好自己的大语言模型后如何微调，激发模型的对话能力，并讨论了如何调用trl库进行预训练。

简单介绍了一下KV Cache的原理以及推理框架vLLM的PagedAttention机制对显存的优化方法。

ubuntu的最基本配置都在这里：远程连接、vim格式配置、命令框优化

到底了