logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习训练(优化)参数的玄学解释

优化的目标:更好、更快梯度局部最小优化的头号敌人是梯度为零,梯度为零即有众所周知的局部最小,还有鞍部点。但幸好在高维空间局部最小并非经常出现,例如下面左图,在一维空间上红点是局部最小,但在二维空间上红点是鞍部点。实际模型参数空间十分复杂,在右侧二维空间的局部最小也在高维空间中大多不是局部最小。batch size用大batch size还是小的呢?较大的batch size训练更快,较小的batc

【错误】 undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11

pip安装完pytorch=1.13.1后,build代码时出错:原因因为pytorch1.13安装时会给我们自动安装但由于一般用户已经安装CUDAtoolkit,所以会产生这个错误。

#pytorch#python
python gdal.RasterizeLayer根据shp、geojson矢量创建栅格

python gdal.RasterizeLayer根据矢量创建栅格实现如下,RasterizeLayer支持shp、geojson等获取的矢量图层。注意:burn_values=[1] 参数一定是序列[1],不能是1,否则报错:TypeError: not a sequenceimport gdalfrom osgeo import ogrfg = 'polygon.geojso...

测试torch方法是否支持半精度

并不是所有的torch方法都支持半精度计算。测试半精度计算需要在cuda上,cpu不支持半精度。因此首先需要创建半精度变量,并放到cuda设备上。部分方法在低版本不支持,在高版本支持半精度计算,部分方法一直不支持。例如行列式计算torch.linalg.det()不支持半精度。d = a.det()是半精度计算,出错,***not implemented for 'Half'c = b.det()

文章图片
#python#深度学习#pytorch
解决python程序崩溃问题double free or corruption (!prev)

这些错误都指向内存重复释放问题,但是暂时无法定位。不过实验发现在文件写操作中增加sleep能缓解错误出现的频率,例如。在执行一个IO很高的oython程序时,会出现内存问题产生内核错误,导致崩溃。

#python
NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.

机器已经安装nvidia驱动,且正常使用,重启后找不到显卡驱动打开终端,用nvidia-smi查看一下,发现如下报错:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.Make sure that the latest NVIDIA driver is installed and running

文章图片
#linux#运维#服务器
华为云OBS数据桶使用

华为云OBS数据桶的使用模式和AWS类似,可以参考这个链接入门总览_对象存储服务 OBS_快速入门_华为云 (huaweicloud.com)概览OBS最基础的入门操作包括创建桶、上传对象和下载对象,通过这三个操作就能完成数据上传和下载。图1为OBS大致的入门使用流程,实际上针对不同的使用方式有细微的差异,具体差异请参考对应使用方式的指导文档,本入门指导旨在帮助您对OBS的入门操作有个初步的认识。

#华为#big data
【旋转框目标检测】2201_The KFIoU Loss For Rotated Object Detection

得益于计算友好且与检测评价指标适配的基于IoU的损失的使用,水平框目标检测领域获得了良好的发展。而旋转检测器通常采用更复杂的SkewIoU(斜IoU),对基于梯度的训练并不友好。论文提出了基于高斯建模和高斯积有效近似SkewIoU的损失。其包括两项。一是尺度不敏感的中心点损失,用于快速缩短两个边界框中心点的距离。二是距离无关项,采用高斯分布的乘积来模仿SkewIoU的机制。在一定距离内(例如9像素

文章图片
#目标检测#深度学习#计算机视觉
【论文-目标检测】RTMDet: An Empirical Study of Designing Real-Time Object Detectors

发展YOLO系列并方便支持实例分割和斜框检测等任务,亮点:设计兼容性backbone和neck,采用大核深度可分离卷积;动态标签分配中采用软标签计算匹配损失;结合训练达到实时检测、实时实例分割和斜框检测SOTA。

文章图片
#目标检测#计算机视觉#深度学习
【PyTorch】CUDA error: device-side assert triggered

pytorch训练时,遇到错误中断CUDA error: device-side assert triggered,按照后面的提示增加环境变量CUDA_LAUNCH_BLOCKING=1

#pytorch#深度学习#python
    共 179 条
  • 1
  • 2
  • 3
  • 18
  • 请选择