logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《Flat-LoRA: Low-Rank Adaptation over a Flat Loss Landscape》

本文提出Flat-LoRA方法,解决了传统LoRA在低秩参数空间优化的局限性。传统LoRA虽能高效微调大模型,但其局部最优解可能在全局参数空间中处于陡峭区域,导致模型鲁棒性和泛化能力不足。Flat-LoRA通过优化低秩矩阵A和B,使模型在全局参数空间中也具备平滑的损失景观。与需要计算"最坏扰动"的LoRA-SAM不同,Flat-LoRA采用更高效的随机扰动策略:优化"

#人工智能#算法#语言模型 +1
到底了