logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

记录一下使用ms-swift训练qwen时遇到的问题

这是我碰到的问题,使用了torch==2.7.1,2.6.0均遇到此问题。由于服务器上其他人并未遇到此问题,因此显卡方面不存在问题,主要问题仍然可能在于torch版本。

#swift#ssh#开发语言
记录一下使用lora微调codellama遇到的问题

使用AutoModelForCausalLM加载模型会报错,改使用LlamaForCausalLM模型告知是因为模型参数没有下载完全导致的错误。在huggingface上下载模型文件的时候需要把红色框中内容全部下载。我使用的是safetensors。

文章图片
#迁移学习#自然语言处理
到底了