蓝书签签个人主页

@m0_56142747

蓝书签签

2023-10-18 13:17:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LORA微调Qwen2.5-0.5B-Instruct大模型

本文以阿里巴巴开源的 Qwen2.5-0.5B-Instruct 为基础模型，手把手演示如何使用 LoRA（Low-Rank Adaptation）完成一次完整的大模型微调实验，将模型的回答风格调整为专业、礼貌的客服话术。文章首先从原理层面介绍 LoRA 的核心思想——冻结原模型权重，仅训练两个低秩旁路矩阵，使可训练参数量降至原模型的约 0.1%，从而大幅降低显存与算力开销。随后按照"环境准备、数

#nlp #java #python

到底了