阳光素描个人主页

@qq_38681990

阳光素描

2023-07-06 10:09:56 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

PyTorch模型训练过程内存泄漏问题解决

这里，self.data_list是dataset类中保存数据字典的列表，index是列表索引。在模型训练的全部过程中，都使用该字典进行数据在不同模型和模块中的传递。由于数据字典始终被dataset所引用，故在全程序运行过程中会始终存在，包括不断加入字典的新数据，因此需要此行代码为。近日，在模型训练过程中，发现过一段时间后进程会被kill，观察发现是由于内存泄漏问题造成的。

#pytorch #人工智能 #python

Diffusion微调报错：RuntimeError: One of the differentiated Tensors does not require grad

由于在微调设置时设置了不微调层的require_grad=False，导致output_grads=None，进而导致torch.autograd.grad失效。解决办法：设置flag=False。最近在开展Diffusion Model模型微调的相关工作时，设置微调层后反传梯度多次遇到以下报错。代码：OpenAI-UNetModel。网路上相关内容较少，特此记录。

#pytorch #人工智能

PyTorch Dataloader报错ValueError: num_samples的另一种可能原因

先粘报错信息：Traceback (most recent call last):File “train.py”, line 169, intrain_test()File “train.py”, line 29, in train_testdataloader_train = DataLoader(dataset_train, batch_size=batch_size, shuffle=Tru

#深度学习 #python #pytorch

到底了