那年聪聪个人主页

@duan19920101

那年聪聪

2022-11-29 15:23:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

目标检测：Fast R-CNN

Fast R-CNN = R-CNN + SPP

#目标检测

目标检测中的图像缩放

目标检测中使用“直接缩放到目标尺寸”的缩放方式精度最高。

目标检测：YOLO（You Only Look Once）

YOLO作为one stage 检测模型的开端，为了解决上述的two stage的典型弊端而生，主要想法就是对于原图进行区域划分，不再进行Region Proposal环节，每个区域就负责回归对应的目标的位置及类别就好，效果也很显著，在GPU机器能够实现45fps，Fast YOLO能够实现155fps，另外对背景的误判率也显著低于RCNN系列。同时有个很有意思的点，YOLO因为能够考虑到图像全局

#深度学习 #目标检测

目标检测——存在的问题

1、anchor box会带来一些问题，比如模型的输出变得非常稠密，因为对应特征图中每个anchor box，都要输出一个4元组的位置预测和对应这个位置的物体分类的预测分数（C类），这样就会生成(C+4)×H×W×6个输出。考虑在多个特征图上进行检测，模型的输出会进一步增加。另外，anchor box需要手动设计，涵盖的尺度有限，一般通过对训练集中目标物体边框尺寸的真实值进行聚类得到，这样会造成对

数据增强方法：图片镜像、图片缩放、图片旋转、加噪点

图片镜像、图片缩放、图片旋转、加噪点

3x3卷积是CNN的主流组件。平时有设计一些解决分类，回归任务的网络，里面的卷积核基本都设置为3x3，VGG16中就用两个3x3的卷积核堆叠能获得5x5卷积核的感受野并且参数比5x5卷积核少，所以是大量推荐使用的。NNCC：2个3*3的卷积核参数量：2*（3*3）=18，3*5的卷积核参数量：5*5=25.即感受野相同的情况下，参数量大大减少（上面情况减少约28%的参数量）。参数量计算：...

数据增强方法：图片镜像、图片缩放、图片旋转、加噪点

图片镜像、图片缩放、图片旋转、加噪点

#opencv #c++#计算机视觉

共 22 条

请选择