logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

解决模型工程化后推理总是输出nan值的问题

摘要:在多模态模型工程化部署过程中,遇到TensorRT推理输出NaN的问题。经排查发现,问题根源在于averagepool和sigmoid算子导致的数值溢出。通过采用clamp限制数值范围、用HardSigmoid替代Sigmoid等方法进行优化后,模型成功转换为TensorRT引擎并输出正常结果。该案例揭示了多模态模型特征融合模块中数值稳定性对部署的重要性,提供了针对浮点溢出的有效解决方案。

报错invalid argument cudaErrorInvalidValue时真的是报错处调用的CUDA函数的出入参数有问题吗?

这里的错误导致分配CUDA内存的大小不对,导致后面给这块CUDA内存拷贝赋值时发生了越界访问从而把CUDA内存搞脏了,然后错误就发生在前面那个核函数调用的地方。CUDA内存弄脏后再访问CUDA内存会出错,但是报的错一般是让你根本无法看出准确原因的,出现莫名其妙的错误时,可能需要整个排查而不是只盯着出错处查,否则可能折腾很久浪费时间还是不知道原因在哪里。有时忘了这个经验浪费不少时间,记录一下备忘。

我的AI之路(26)--使用ROSBridge WebSocket和roslibjs构建一个简单的控制机器人的web demo

在一个复杂的机器人后端控制平台系统开发完成以前,往往需要对你的机器人产品进行简单的软件架构设计验证或进行控制测试,这时,如果能花比较少的时间快速做一个web页面或者一个Android app来作此用途的话能节省不少人力,本人花比较少的时间做了一个web demo和几个安卓app用于不同机器人的通讯和控制的验证和测试,先只说怎么做web demo,实现安卓app的思路跟基于Java EE开...

#AI
NVIDIA Jetson板子上安装nvidia docker需要注意的问题

一般来说,使用NVIDIA官网上下载的sdk image烧写入SD卡或者使用sdk manager/jet package连到板子安装全部软件后,里面什么都有了,包括docker和nvidia docker里面都有了,使用nvidia docker可以把GPU用起来,但是如果误删或者不小心弄坏了docker,或者为了减少发布系统的image的大小,尽量减少不需要安装的软件包,比如想从最基本的Bas

#docker
如何定位TypeError: cannot pickle dict_keys object错误原因及解决NuScenes数据集在多进程并发训练或测试时出现的这个错误

UniAD的NuScenesE2EDataset继承自NuScenesDataset,其实例里面的eval_detection_configs数据就是这么来的,里面的class_names的值默认是通过dict.keys()获得的,没有转换成Pickler支持的类型,这才导致了TypeError: cannot pickle 'dict_keys' object

#python
Docker、nvidia-container-toolkit安装与常用docker命令及docker镜像和容器的更新维护

Python的virtual env和Anaconda的env可以用来做环境隔离防止不同的模型环境之间在安装时相互影响甚至因为支持包的版本冲突导致不能同时使用,但是不具备打包发布部署的功能,想要调试好一个用于训练或者模型运行调用的环境后直接可以打包发布部署到别的linux机器上,还是非docker莫属,Docker作为隔离运行和部署的工具利器,现在使用越来越多,要想在生产环境中使用同一......

Apollo 编译时报错 ERROR: Config value ‘gpu‘ is not defined in any .rc file

Apollo官网上下载的代码编译是没这个问题的,我用的这个是某个beta版,可能新旧版本代码和编译环境里的bazel版本之间兼容没做好。用Apollo的某个版本的源码,执行。创建容器并进入容器后执行。

3D目标检测(一)

​做3D目标检测,首先要了解雷达坐标系和相机坐标系这两个坐标系和数据标注等方面的基础,下面结合kitti3D数据集来讲解。kitti数据集在3D目标检测领域有点类似PASCAL VOC和COCO在2D目标检测和分割领域的经典地位,数据量不算很大,各类别数量很不均衡,但是很多模型要刷榜和发论文都用这个数据集,它里面同时提供了2d和3d目标标注,还有分割和跟踪等数据挺全的,所以用于模型实验和验证以及准

文章图片
#3d#目标检测
3D目标检测(一)

​做3D目标检测,首先要了解雷达坐标系和相机坐标系这两个坐标系和数据标注等方面的基础,下面结合kitti3D数据集来讲解。kitti数据集在3D目标检测领域有点类似PASCAL VOC和COCO在2D目标检测和分割领域的经典地位,数据量不算很大,各类别数量很不均衡,但是很多模型要刷榜和发论文都用这个数据集,它里面同时提供了2d和3d目标标注,还有分割和跟踪等数据挺全的,所以用于模型实验和验证以及准

文章图片
#3d#目标检测
树莓派4B上ncnn转换出来的模型调用时总是崩溃(Segment Fault)的原因

最近拿到一个树莓派$B的板子做实验,在上面编译出ncnn后,将模型转换出bin和param文件后调用时总是因为Segment Fault崩溃,编译了个debug版的ncnn后用gdb查一下,发现总是崩溃在convolution_3x3.h里:崩溃处的代码是:r0是当前layer的输入特征数据,k0是卷积核数据,表面看不出有何问题,后来从头检查了一下,发现板子烧写的是32位的系统(armv7l),不

    共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择