
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Fast R-CNN = R-CNN + SPP
目标检测中使用“直接缩放到目标尺寸”的缩放方式精度最高。
YOLO作为one stage 检测模型的开端,为了解决上述的two stage的典型弊端而生,主要想法就是对于原图进行区域划分,不再进行Region Proposal环节,每个区域就负责回归对应的目标的位置及类别就好,效果也很显著,在GPU机器能够实现45fps,Fast YOLO能够实现155fps,另外对背景的误判率也显著低于RCNN系列。同时有个很有意思的点,YOLO因为能够考虑到图像全局
1、anchor box会带来一些问题,比如模型的输出变得非常稠密,因为对应特征图中每个anchor box,都要输出一个4元组的位置预测和对应这个位置的物体分类的预测分数(C类),这样就会生成(C+4)×H×W×6个输出。考虑在多个特征图上进行检测,模型的输出会进一步增加。另外,anchor box需要手动设计,涵盖的尺度有限,一般通过对训练集中目标物体边框尺寸的真实值进行聚类得到,这样会造成对
图片镜像、图片缩放、图片旋转、加噪点
基于“视频图像”的人脸识别算法
3x3卷积是CNN的主流组件。平时有设计一些解决分类,回归任务的网络,里面的卷积核基本都设置为3x3,VGG16中就用两个3x3的卷积核堆叠能获得5x5卷积核的感受野并且参数比5x5卷积核少,所以是大量推荐使用的。NNCC:2个3*3的卷积核参数量:2*(3*3)=18,3*5的卷积核参数量:5*5=25.即感受野相同的情况下,参数量大大减少(上面情况减少约28%的参数量)。参数量计算:...
人脸识别关键问题研究(光照、姿态)
目标检测 OpenCV
图片镜像、图片缩放、图片旋转、加噪点







