
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
📝 写在前面在成功完成模型部署后,我决定挑战更高难度的模型微调。本次微调的目标是让通义千问Qwen3.5-4B模型能够更好地理解和描述机器人图像。整个过程在魔乐社区的昇腾NPU环境下完成,使用LLaMA-Factory工具进行LoRA微调。一、微调任务与数据集介绍1.1 微调目标让Qwen3.5-4B模型能够准确识别图片中的机器人,并描述其特征(如外观、颜色、结构等)。1.2 数据集说明使用 m
📝 写在前面在成功完成模型部署后,我决定挑战更高难度的模型微调。本次微调的目标是让通义千问Qwen3.5-4B模型能够更好地理解和描述机器人图像。整个过程在魔乐社区的昇腾NPU环境下完成,使用LLaMA-Factory工具进行LoRA微调。一、微调任务与数据集介绍1.1 微调目标让Qwen3.5-4B模型能够准确识别图片中的机器人,并描述其特征(如外观、颜色、结构等)。1.2 数据集说明使用 m
📝 写在前面在成功完成模型部署后,我决定挑战更高难度的模型微调。本次微调的目标是让通义千问Qwen3.5-4B模型能够更好地理解和描述机器人图像。整个过程在魔乐社区的昇腾NPU环境下完成,使用LLaMA-Factory工具进行LoRA微调。一、微调任务与数据集介绍1.1 微调目标让Qwen3.5-4B模型能够准确识别图片中的机器人,并描述其特征(如外观、颜色、结构等)。1.2 数据集说明使用 m
本文详细记录了在魔乐社区昇腾NPU环境中部署Qwen2.5-VL-3B-Instruct和DeepSeek-R1-Distill-Qwen-7B两个国产大模型的全过程。作者首先解决了torch与torch_npu版本严格匹配的关键问题,随后通过LLaMA-Factory工具成功运行了两个模型,并对比了它们的性能表现。文章提供了完整的环境配置方案、常见问题解决方法以及一键部署脚本,展示了国产大模型与

本文详细记录了在魔乐社区昇腾NPU环境中部署Qwen2.5-VL-3B-Instruct和DeepSeek-R1-Distill-Qwen-7B两个国产大模型的全过程。作者首先解决了torch与torch_npu版本严格匹配的关键问题,随后通过LLaMA-Factory工具成功运行了两个模型,并对比了它们的性能表现。文章提供了完整的环境配置方案、常见问题解决方法以及一键部署脚本,展示了国产大模型与

本文详细记录了在魔乐社区昇腾NPU环境中部署Qwen2.5-VL-3B-Instruct和DeepSeek-R1-Distill-Qwen-7B两个国产大模型的全过程。作者首先解决了torch与torch_npu版本严格匹配的关键问题,随后通过LLaMA-Factory工具成功运行了两个模型,并对比了它们的性能表现。文章提供了完整的环境配置方案、常见问题解决方法以及一键部署脚本,展示了国产大模型与








