m0_66999004 个人主页

@m0_66999004

m0_66999004

2024-04-29 09:23:32 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

显存不足跑不动大模型？一文掌握 Kaggle 平台 GPU 全流程使用方案

教你掌握 Kaggle 平台 GPU 全流程使用方案

#人工智能 #深度学习 #pytorch +1

【踩坑解决】多GPU(DataParallel)训练模型，单GPU测试报错、准确率固定0.5问题根治

在使用GoogLeNet训练猫狗分类数据集时，采用DataParallel多GPU并行训练保存的权重文件，切换单GPU环境测试时，会出现模型参数Key值不匹配的报错。通过strict=False参数规避报错，进而引发模型权重加载失效、准确率固定0.5的核心问题，模型等同于随机初始化猜值。本文结合实战场景，深度剖析多GPU训练权重自带module前缀的底层原理，拆解strict=False的致命坑点

#人工智能 #深度学习 #机器学习 +1

到底了