【错误记录】RuntimeError: Error(s) in loading state_dict for DataParallel: size mismatch for module

【记犯的一次低级错误】完整错误信息如下：RuntimeError: Error(s) in loading state_dict for DataParallel:size mismatch for module.lstm_block.lstm.weight_ih_l0: copying a param with shape torch.Size([1024, 500]) from checkpo

文章共654字 · 阅读需要大约3分钟

一键AI生成摘要，助你高效阅读

问答

启正不歪

22907人浏览 · 2021-11-30 16:07:22

启正不歪 · 2021-11-30 16:07:22 发布

【记犯的一次低级错误】

完整错误信息如下：

RuntimeError: Error(s) in loading state_dict for DataParallel:
	size mismatch for module.lstm_block.lstm.weight_ih_l0: copying a param with shape torch.Size([1024, 500]) from checkpoint, the shape in current model is torch.Size([1024, 2000]).

错哪了：

错误意思大概是加载state_dict时，参数不匹配。百度基本都说是PyTorch版本环境不一致、torch.nn.DataParallel()关键字不匹配等，提出的解决办法是把strict参数赋False，如下：

checkpoint_file = os.path.join(args.checkpoint, args.test+'.pth.tar')
checkpoint = torch.load(checkpoint_file) 
model.load_state_dict(checkpoint['state_dict'],False) # 修改处

但这招在我这行不通，思来想去最后在Google找到答案，不得不说stack overflow还是牛。实际原因是一个很低级的错误：就是模型初始化的一个参数错了。

这是我的训练代码：

win_width     = 5        # 样本长度，单位为秒
time_steps    = win_width * sample_rate
num_variables = 2

model = LSTMFCN(time_steps, num_variables)

然而预测代码是这样的：

win_width     = 20        # 样本长度，单位为秒
time_steps    = win_width * sample_rate
num_variables = 2

model = LSTMFCN(time_steps, num_variables)

看看人家是怎么说的

Stack Overflow：Size Mismatch Runtime Error When Trying to Load a PyTorch Model
在这里插入图片描述

最终解决办法：

把参数改成和训练时一样的就OK啦。

Reference

[1] Stack Overflow：Size Mismatch Runtime Error When Trying to Load a PyTorch Model
[2] CSDN：pytorch加载模型报错RuntimeError:Error(s) in loading state_dict for DataParallel

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

GitTalk | 使用面向业务的狮偶编程语言提升开发效率

GitCode 开源社区

GitTalk | DevUI Suits 场景解决方案

GitCode 开源社区

GitTalk | DevUI Admin 前端项目构建

GitCode 开源社区

所有评论(0)

查看更多评论

启正不歪

@Qz574662449

已为社区贡献1条内容