logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于GPU加速的Opencv库 & 利用cmake和vs2019重新配置并生成Opencv-cuda版本

一、环境安装:二、cmake重新配置Opencv三、VS2019生成Opencv-cuda版本的库四、配置Opencv环境五、cmake配置时碰到的BUG(1)问题1:CUDA_nppicom_LIBRARY(ADVANCED),找不到opencv_contrib-4.1.0/modules中的文件 ?(2)问题2:运行demo程序时,错误MSB8020无法找到v143的生成工具(平台工具集=“v

文章图片
#opencv#计算机视觉
深度剖析问题:Could not run ‘torchvision::nms‘ with arguments from the ‘CUDA‘ backend.

(2)根据后台提示的信息,分析源码,进行问题的解决,下面是解决问题的过程:分析代码行:return torch.ops.torchvision.nms(boxes, scores, iou_threshold),ctrl + 鼠标左键点击 nms,进入到下一个文件,截图如下图所示:在函数nms内部做一个标志(print(22222222222222)),观察能否调用函数nms,经测试发现没有调用函

文章图片
#深度学习#人工智能#python +1
关于YOLOv5标签命名问题的报错解决(assert mlc < nc, ‘Label class %g exceeds nc=%g in %s.)

目录一. 泰迪杯害虫检测训练的时候,碰到如下问题:二. 解决步骤一. 泰迪杯害虫检测训练的时候,碰到如下问题:Label class 485 exceeds nc=28 in data/pest.yaml. Possible class labels are 0-27翻译:在文件pest.yaml中,标签类485超过nc=28。可能的类标签是0-27自定义的标签数值:labels = ['6',

文章图片
#python#计算机视觉#图像处理 +1
你真正了解图像金字塔吗?详细介绍拉普拉斯金字塔和高斯金字塔(pyrDown() and pyrUp()),参考《OpenCV轻松入门:面向Python》

向上采样指:调用函数pyrUp(),放大图像调用函数;向下采样指:调用函数pyrDown(),缩放图像。图像金字塔是由一幅图像的多个不同分辨率的子图所构成的图像集合(如下图所示)。该组图像是由单个图像通过不断地降采样所产生的,最小的图像可能仅仅有一个像素点。拉普拉斯金字塔中的第 i 层,等于“高斯金字塔中的第 i 层”与“高斯金字塔中的第 i+1 层的向上采样结果”之差。如下图所示,展示了高斯金字

文章图片
#opencv#机器学习#计算机视觉 +2
论文精读 && Co-DETR(Co-DINO、Co-Deformable-DETR)

1. Co-DETR基于DAB-DETR、Deformable-DETR和DINO网络进行了实验。2. Co-DETR发现DETR及其变体网络是一对一标签分配,指出了其中的问题,随之提出一对多标签分配监督多个并行辅助头的方法。3. 为了提高解码器中正样本(positive samples)的训练效率,Co-DETR从辅助头中提取正坐标(positive coordinates)来进行额外定制的正查

文章图片
#深度学习#人工智能#transformer
DETR 论文精读,并解析模型结构

我们提出了一种新的方法,将目标检测视为一个直接的集合预测问题。我们的方法精简了检测管道,有效地消除了许多手工设计的组件,如非极大值抑制过程或锚生成,这些组件显式地编码了我们关于任务的先验知识。新框架的主要组成部分,称为DEtectTRansformer或DETR,是一个基于集合的全局损耗,通过二分匹配和一个转换器编码器-解码器架构强制进行唯一的预测。给定一个固定的小规模学习对象查询集,DETR根据

文章图片
#深度学习#计算机视觉#transformer +1
关于YOLOv5标签命名问题的报错解决(assert mlc < nc, ‘Label class %g exceeds nc=%g in %s.)

目录一. 泰迪杯害虫检测训练的时候,碰到如下问题:二. 解决步骤一. 泰迪杯害虫检测训练的时候,碰到如下问题:Label class 485 exceeds nc=28 in data/pest.yaml. Possible class labels are 0-27翻译:在文件pest.yaml中,标签类485超过nc=28。可能的类标签是0-27自定义的标签数值:labels = ['6',

文章图片
#python#计算机视觉#图像处理 +1
通过公式和源码解析 DETR 中的损失函数 & 匈牙利算法(二分图匹配)

DETR在单次通过解码器时推断一个固定大小的有N个预测的集合,其中N被设置为显著大于图像中典型的物体数量。所有真实框中的每一个框和所有预测框进行匹配,损失值最小的预测框为该真实框的最佳匹配框,当所有真实框遍历完毕后,得到所有唯一匹配的框。完成最优分配,假设有六位老师和六种课程,通过匈牙利算法进行匹配后,每一位老师都会分到不同的一个课程。匹配成功之后,对预测框的分数、类别、中心点坐标和宽高进行损失值

文章图片
#人工智能#深度学习#神经网络 +1
从传统算法过渡到深度学习(从经典GMM-BackgroundSubtractorMOG2到BackgroundMatting),运动目标检测实战

首先收集非常多的人物肖像数据集,然后搭建两个神经网络,即引入了一个base网络,它可以在较低的分辨率下预测alpha matte和前景层,以及一个预测误差图,它指定了可能需要高分辨率精细化的区域。然后,使用一个refinement网络将低分辨率的结果和原始图像结合在一起,只在选定区域生成高分辨率的输出。最后达到了惊人的效果

文章图片
#机器学习#计算机视觉#github +1
计算模型的GFLOPs和参数量 & 举例VGG16和DETR

近期忙于写论文,分享一下论文中表格数据的计算方法。FLOPS:注意S是大写,是“每秒所执行的浮点运算次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒,而不是复数,所以不能省略掉。FLOPs:注意s小写,是floating point operati

文章图片
#pytorch#深度学习#人工智能 +2
    共 14 条
  • 1
  • 2
  • 请选择