logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LORA微调Qwen2.5-0.5B-Instruct大模型

本文以阿里巴巴开源的 Qwen2.5-0.5B-Instruct 为基础模型,手把手演示如何使用 LoRA(Low-Rank Adaptation)完成一次完整的大模型微调实验,将模型的回答风格调整为专业、礼貌的客服话术。文章首先从原理层面介绍 LoRA 的核心思想——冻结原模型权重,仅训练两个低秩旁路矩阵,使可训练参数量降至原模型的约 0.1%,从而大幅降低显存与算力开销。随后按照"环境准备、数

#nlp#java#python
到底了