logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

#魔乐新年征文赛·微调日志# Qwen3.5-4B在昇腾NPU上的LoRA微调实战

📝 写在前面在成功完成模型部署后,我决定挑战更高难度的模型微调。本次微调的目标是让通义千问Qwen3.5-4B模型能够更好地理解和描述机器人图像。整个过程在魔乐社区的昇腾NPU环境下完成,使用LLaMA-Factory工具进行LoRA微调。一、微调任务与数据集介绍1.1 微调目标让Qwen3.5-4B模型能够准确识别图片中的机器人,并描述其特征(如外观、颜色、结构等)。1.2 数据集说明使用 m

#魔乐新年征文赛·微调日志# Qwen3.5-4B在昇腾NPU上的LoRA微调实战

📝 写在前面在成功完成模型部署后,我决定挑战更高难度的模型微调。本次微调的目标是让通义千问Qwen3.5-4B模型能够更好地理解和描述机器人图像。整个过程在魔乐社区的昇腾NPU环境下完成,使用LLaMA-Factory工具进行LoRA微调。一、微调任务与数据集介绍1.1 微调目标让Qwen3.5-4B模型能够准确识别图片中的机器人,并描述其特征(如外观、颜色、结构等)。1.2 数据集说明使用 m

#魔乐新年征文赛·微调日志# Qwen3.5-4B在昇腾NPU上的LoRA微调实战

📝 写在前面在成功完成模型部署后,我决定挑战更高难度的模型微调。本次微调的目标是让通义千问Qwen3.5-4B模型能够更好地理解和描述机器人图像。整个过程在魔乐社区的昇腾NPU环境下完成,使用LLaMA-Factory工具进行LoRA微调。一、微调任务与数据集介绍1.1 微调目标让Qwen3.5-4B模型能够准确识别图片中的机器人,并描述其特征(如外观、颜色、结构等)。1.2 数据集说明使用 m

#魔乐新年征文赛·极速部署# 昇腾NPU上适配Qwen和DeepSeek双模型实战:从环境配置到成功对话全记录

本文详细记录了在魔乐社区昇腾NPU环境中部署Qwen2.5-VL-3B-Instruct和DeepSeek-R1-Distill-Qwen-7B两个国产大模型的全过程。作者首先解决了torch与torch_npu版本严格匹配的关键问题,随后通过LLaMA-Factory工具成功运行了两个模型,并对比了它们的性能表现。文章提供了完整的环境配置方案、常见问题解决方法以及一键部署脚本,展示了国产大模型与

文章图片
#魔乐新年征文赛·极速部署# 昇腾NPU上适配Qwen和DeepSeek双模型实战:从环境配置到成功对话全记录

本文详细记录了在魔乐社区昇腾NPU环境中部署Qwen2.5-VL-3B-Instruct和DeepSeek-R1-Distill-Qwen-7B两个国产大模型的全过程。作者首先解决了torch与torch_npu版本严格匹配的关键问题,随后通过LLaMA-Factory工具成功运行了两个模型,并对比了它们的性能表现。文章提供了完整的环境配置方案、常见问题解决方法以及一键部署脚本,展示了国产大模型与

文章图片
#魔乐新年征文赛·极速部署# 昇腾NPU上适配Qwen和DeepSeek双模型实战:从环境配置到成功对话全记录

本文详细记录了在魔乐社区昇腾NPU环境中部署Qwen2.5-VL-3B-Instruct和DeepSeek-R1-Distill-Qwen-7B两个国产大模型的全过程。作者首先解决了torch与torch_npu版本严格匹配的关键问题,随后通过LLaMA-Factory工具成功运行了两个模型,并对比了它们的性能表现。文章提供了完整的环境配置方案、常见问题解决方法以及一键部署脚本,展示了国产大模型与

文章图片
到底了