logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Pytorch 训练停止,输出显示 died with <Signals,SIGKILL.9> 问题定位过程记录

最近使用 Pytorch 进行模型训练时,模型在训练到一小部分后程序均被停止。第一次以为是由于机器上其他人的误操作,故而直接重新拉起训练。但第二次程序终止时,发现基本与第一次训练停止的训练 iteration 一致,故而尝试对问题进行定位。问题描述具体而言,在使用 Pytorch 训练时的错误信息类似如下所示:File "/usr/lib/python3.7/runpy.py", line 193

#pytorch#python
[win10] ffmpeg gpu加速

ffmpeg 基础转:https://blog.csdn.net/qq_39575835/article/details/83505205根据NVIDIA官网,https://developer.nvidia.com/FFmpeg。如下的gpu被支持使用ffmpeg的gpu加速。FFmpeg GPU HW-Acceleration Support TableFermi...

swin transformer 核心代码记录

目前更新部分包括swin的基本setting,基本模块,相对位置坐标理解和部分代码展示。swin 包含了四种setting,依次是tiny,small, base 和 large。可以类比resnet。Swin-b 主体部分网络结构BasicLayer结构展示BasicLayer((blocks): ModuleList((0): SwinTransformerBlock((norm1): Lay

#transformer#深度学习#人工智能
Pytorch 训练停止,输出显示 died with <Signals,SIGKILL.9> 问题定位过程记录

最近使用 Pytorch 进行模型训练时,模型在训练到一小部分后程序均被停止。第一次以为是由于机器上其他人的误操作,故而直接重新拉起训练。但第二次程序终止时,发现基本与第一次训练停止的训练 iteration 一致,故而尝试对问题进行定位。问题描述具体而言,在使用 Pytorch 训练时的错误信息类似如下所示:File "/usr/lib/python3.7/runpy.py", line 193

#pytorch#python
pytorch 分布式

返回当前进程组的排名torch.distributed.get_rank() # 返回当前进程组的排名

深度学习中的EMA

参考两篇博客即可学会。【炼丹技巧】指数移动平均(EMA)的原理及PyTorch实现理解滑动平均(exponential moving average)

pytorch 分布式

返回当前进程组的排名torch.distributed.get_rank() # 返回当前进程组的排名

视网膜图像分割数据集整理

视网膜图像分割数据集1. DRIVE2. CHASE_DB13. STARE1. DRIVE官网:http://www.isi.uu.nl/Research/Databases/DRIVE/文章:J. Staal, M. Abramoff, M. Niemeijer, M. Viergever, andB. van Ginneken, “Ridge based vessel segmen...

#深度学习#图像处理
win10 cuda_小白之旅(5):gridIdx, blockIdx 和 threadIdx 区别与联系

博主自己学习,仅此记录,并方便学过c、已经配置好cuda的朋友交流学习。(我机子cuda9.0)ok,记录一下gridIdx, blockIdx 和 threadIdx的区别和联系,因为使用add<<<N,M>>>(args)时候难免要分线程,而且这块的理解也很关键。这里,我们先讲一维情况,再说一下二维的情况一维索

视网膜图像分割数据集整理

视网膜图像分割数据集1. DRIVE2. CHASE_DB13. STARE1. DRIVE官网:http://www.isi.uu.nl/Research/Databases/DRIVE/文章:J. Staal, M. Abramoff, M. Niemeijer, M. Viergever, andB. van Ginneken, “Ridge based vessel segmen...

#深度学习#图像处理
    共 20 条
  • 1
  • 2
  • 请选择