
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
记录一下使用ms-swift训练qwen时遇到的问题
这是我碰到的问题,使用了torch==2.7.1,2.6.0均遇到此问题。由于服务器上其他人并未遇到此问题,因此显卡方面不存在问题,主要问题仍然可能在于torch版本。
记录一下使用lora微调codellama遇到的问题
使用AutoModelForCausalLM加载模型会报错,改使用LlamaForCausalLM模型告知是因为模型参数没有下载完全导致的错误。在huggingface上下载模型文件的时候需要把红色框中内容全部下载。我使用的是safetensors。

到底了







