logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

人工智能论文通用创新点(持续更新中...)

论文同样创新点汇总:1.自注意力机制与卷积结合2.新的坐标注意力机制Coordinate Attention3. 更好的下采样操作SPD

文章图片
#人工智能#深度学习#计算机视觉 +3
LoRA微调大语言模型Bert

LoRA是一种流行的微调大语言模型的手段,这是因为LoRA仅需在预训练模型需要微调的地方添加旁路矩阵。LoRA 的作者们还提供了一个易于使用的库 loralib,它极大地简化了使用 LoRA 微调模型的过程。这个库允许用户轻松地将 LoRA 层添加到现有的模型架构中,而无需深入了解其底层实现细节。这使得 LoRA 成为了一种非常实用的技术,既适合研究者也适合开发人员。下面给出了一个LoRA微调Be

文章图片
#人工智能#深度学习#机器学习 +1
到底了