
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
LORA详解(搬运)
搬运自LoRA模型,全称Low-Rank Adaptation of Large Language Models,是一种用于微调大型语言模型的低秩适应技术。它最初应用于NLP领域,特别是用于微调GPT-3等模型。LoRA通过仅训练低秩矩阵,然后将这些参数注入到原始模型中,从而实现对模型的微调。这种方法不仅减少了计算需求,而且使得训练资源比直接训练原始模型要小得多,因此非常适合在资源有限的环境

怎么指定cuda版本安装xformers
直接pip安装xformers会默认使用支持该xformers的cuda最高版本,可能和环境的cuda版本不对应。中的方法可以指定cuda版本,我的pytorch时2.3.0问题解决。

到底了







