logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【TensorRT】TensorRT踩过的坑

1、TensorRT发布的模型(engine)不能跨平台使用例如linux发布的模型不能在windows下用。2、TensorRT发布的模型需要在相同GPU算力(compute capability)的情况下使用否则会导致compute capability不匹配问题,例如算力7.0发布的模型不能在7.5上用。查询显卡算力:CUDA GPUs | NVIDIA Developer3、TensorR

【调参】batch_size的选择

当有足够算力时,选取batch size为32或更小一些。算力不够时,在效率和泛化性之间做trade-off,尽量选择更小的batch size。当模型训练到尾声,想更精细化地提高成绩(比如论文实验/比赛到最后),有一个有用的trick,就是设置batch size为1,即做纯SGD,慢慢把error磨低。

#深度学习#cnn#人工智能
深度学习优化利器:集成、知识蒸馏和自蒸馏

为什么简单的「集成」便能够提升性能呢?本文是对上述问题的解析,作者解读了来自微软研究院高级研究员朱泽园博士,以及卡内基梅隆大学机器学习系助理教授李远志的最新论文《在深度学习中理解集成,知识蒸馏和自蒸馏》。本文授权转自智源社区,作者梦佳集成(Ensemble,又称模型平均)是一种「古老」而强大的方法。只需要对同一个训练数据集上,几个独立训练的神经网络的输出,简单地求平均,便可以获得比原有模型更高的性

【旋转框目标检测】2201_The KFIoU Loss For Rotated Object Detection

得益于计算友好且与检测评价指标适配的基于IoU的损失的使用,水平框目标检测领域获得了良好的发展。而旋转检测器通常采用更复杂的SkewIoU(斜IoU),对基于梯度的训练并不友好。论文提出了基于高斯建模和高斯积有效近似SkewIoU的损失。其包括两项。一是尺度不敏感的中心点损失,用于快速缩短两个边界框中心点的距离。二是距离无关项,采用高斯分布的乘积来模仿SkewIoU的机制。在一定距离内(例如9像素

文章图片
#目标检测#深度学习#计算机视觉
ONNXRuntime (Python) GPU 部署配置记录

0. 前言最近偶尔捣鼓了一下onnxruntime-gpu(python版本)的服务端部署,于是打算简单记录一下一些关键步骤,免得以后忘了。确实,有些时候我们并不全是需要把模型转成MNN/ncnn/TNN后走移动端部署那套,服务端的部署也是个很重要的场景。比较常用的服务端部署方案包括tensorrt、onnxruntime-gpu等等。onnxruntime-gpu版本可以说是一个非常简单易用的框

#pytorch#深度学习#人工智能
GDAL错误:ImportError: libpoppler.so.126: cannot open shared object file: No such file or directory

libpoppler.so.126​文件缺失了,查找网上解决办法知道需要下载正确的poppler​库。的解答办法,下载libpoppler.so.126文件,上传到服务器指定位置/home/XXXX/anaconda3/envs/XXXX/lib/​下,解决问题。原文链接:https://blog.csdn.net/m0_62443558/article/details/142880775。con

文章图片
#python#linux#开发语言
命令行运行Python脚本时传入参数的三种方式

From:https://blog.csdn.net/weixin_35653315/article/details/72886718三种常用的方式如果在运行python脚本时需要传入一些参数,例如gpus与batch_size,可以使用如下三种方式。python script.py 0,1,2 10python script.py -gpus=0,1,2 --batch-size...

百度地图POI数据获取

转载自:https://blog.csdn.net/baidu_26646129/article/details/80464447本文主要介绍百度地图POI数据获取:从百度地图得到POI数据,以json格式保存;POI数据获取的原理部分还可以参照零基础掌握百度地图兴趣点获取POI爬虫(python语言爬取)(基础篇)。POI数据获取百度地图POI数据可以从百度地图提供的API——兴趣点...

深度学习训练(优化)参数的玄学解释

优化的目标:更好、更快梯度局部最小优化的头号敌人是梯度为零,梯度为零即有众所周知的局部最小,还有鞍部点。但幸好在高维空间局部最小并非经常出现,例如下面左图,在一维空间上红点是局部最小,但在二维空间上红点是鞍部点。实际模型参数空间十分复杂,在右侧二维空间的局部最小也在高维空间中大多不是局部最小。batch size用大batch size还是小的呢?较大的batch size训练更快,较小的batc

【错误】 undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11

pip安装完pytorch=1.13.1后,build代码时出错:原因因为pytorch1.13安装时会给我们自动安装但由于一般用户已经安装CUDAtoolkit,所以会产生这个错误。

#pytorch#python
    共 181 条
  • 1
  • 2
  • 3
  • 19
  • 请选择