
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
初探大模型微调
可以前往huggingface下载baichuan-7B模型,下载后模型文件位于baichuan-inc/baichuan-7B中,其中包含预训练模型,模型配置参数,特定的分词器等文件,项目文件夹里有baichuan-inc/baichuan-7B这个目录,不过里面的模型文件被我删除了,下载直接覆盖这个文件夹就行,或者单独把下载后的模型文件复制到baichuan-inc/baichuan-7B/下

初探大模型微调
可以前往huggingface下载baichuan-7B模型,下载后模型文件位于baichuan-inc/baichuan-7B中,其中包含预训练模型,模型配置参数,特定的分词器等文件,项目文件夹里有baichuan-inc/baichuan-7B这个目录,不过里面的模型文件被我删除了,下载直接覆盖这个文件夹就行,或者单独把下载后的模型文件复制到baichuan-inc/baichuan-7B/下

FUTR3D论文实验环境配置及运行
注意了,这个项目代码里有.cuda()的操作,这个操作默认会在第一张显卡进行,所以最好是空出第一块显卡,要不然代码跑到这会因为张量在不同显卡上报错(心累,还得找到有BUG的地方,把tensor移到统一显卡上,还好,我只发现了一个这样的问题,不过在80G显存上跑可以完全忽略这个问题,显存大就是任性),训练时batch设成了1,大概占用10G显存。可能会遇到的错:RuntimeError: /tmp/
到底了







