logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

残差网络学习心得

残差网络学习心得残差网络介绍为什么残差网络有如此好的表现?残差网络介绍ResNets是由残差块构建的,首先先解释一下什么是残差块。这是一个两层神经网络在L层进行激活。计算过程是从a[l]开始,首先进行线性激活 。根据这个等式,通过a[l]算出z[l+1]即a[l]乘以权重矩阵再加上偏差因子,然后通过非线性Relu激活得到a[l+1]。随后我们再进行线性激活,从下面等式可以得出z[l...

目标检测label assignment:A Dual Weighting Label Assignment Scheme

在目标检测中,为了与NMS兼容,一个好的检测器应该能够预测具有较高分类得分和精确位置的box。然而,如果所有的训练样本都被同等处理,两个头部之间就会出现错位:类别得分最高的位置通常不是回归对象边界的最佳位置。这种失调会降低检测器的性能,特别是在高IoU指标下。soft label assignment是通过加权损失以软标签的方式处理训练样本,试图增强cls和reg头之间的一致性。

文章图片
#目标检测#计算机视觉#深度学习
一文看懂YOLO v3

论文地址:https://pjreddie.com/media/files/papers/YOLOv3.pdf论文:YOLOv3: An Incremental ImprovementYOLO系列的目标检测算法可以说是目标检测史上的宏篇巨作,接下来我们来详细介绍一下YOLO v3算法内容,v3的算法是在v1和v2的基础上形成的,所以有必要先回忆: 一文看懂YOLO v2,一文看懂YOLO v2..

文章图片
#目标检测#深度学习
目标检测mAP

目标检测与图像分类不同,目标检测不仅要对检测出来的目标框正确分类,同时,还需要考虑目标框与target是否贴合。首先我们需要知道几个常见指标:TP (True Positive):iou>0.5的检测框数量。在上图中,绿色的框表示GT,其中cat 0.9的红色框就是TP。FP (False Positive):iou<=0.5的检测框。cat 0.3的红色框与GT的IOU小于0.5所以

#python#计算机视觉#深度学习 +2
pytorch 如何在改变基础网络之后使用预训练模型

我们在做具体的项目时,经常需要我们改变基础网络,但手头上的数据有限,所以想高质量的完成项目,我们需要使用预训练模型。这里我介绍一种方法能够在改变基础网络的同时加载预训练模型。1.在原有backbone中增加层并载入pretrained modelclass ResNet(nn.Module):def __init__(self, block, layers, num_classes...

#深度学习#神经网络#人工智能 +1
目标检测mAP

目标检测与图像分类不同,目标检测不仅要对检测出来的目标框正确分类,同时,还需要考虑目标框与target是否贴合。首先我们需要知道几个常见指标:TP (True Positive):iou>0.5的检测框数量。在上图中,绿色的框表示GT,其中cat 0.9的红色框就是TP。FP (False Positive):iou<=0.5的检测框。cat 0.3的红色框与GT的IOU小于0.5所以

#python#计算机视觉#深度学习 +2
一文看懂YOLO v8

2023年,YOLO系列已经迭代到v8,v8与v5均出自U神,为了方便理解,我们将通过与v5对比来讲解v8。想了解v5的可以参考文章。

文章图片
#深度学习#目标检测
python 前缀和总结

前缀和是数据结构与算法中比较重要的知识,前缀和经常可以结合哈希表解决很多有意思的问题。为了方便学习,在这里总结leetcode中出现的前缀和问题。525. 连续数组给定一个二进制数组 nums (只含有0,1), 找到含有相同数量的 0 和 1 的最长连续子数组,并返回该子数组的长度。示例 1:输入: nums = [0,1]输出: 2说明: [0, 1] 是具有相同数量0和1的最长连续子数组。示

#数据结构#算法#leetcode
目标检测以及分类任务中的评价指标(roc,auc,map等)

我们在分类任务中经常用ROC曲线与AUC来衡量分类器的好坏。在理解之前,我首先介绍一下混淆矩阵。混淆矩阵在二分类问题上,真实类别分为:F:反例;T:正例;预测类别:P:正例;N:反例。真正例TP(true postive):样本真实类别为1,学习模型预测的类别也为1假正例FP(false postive):样本真实类别为0,学习模型预测的类别为1真反例TN(true negative):样本真实类

#机器学习#深度学习#人工智能
一文看懂DETR(三)

1.输入图像经过CNN的backbone获得32倍下采样的深度特征;2.将图片给拉直形成token,并添加位置编码送入encoder中;3.将encoder的输出以及Object Query作为decoder的输入得到解码特征;4.将解码后的特征传入FFN得到预测特征;5.根据预测特征计算cost matrix,并由匈牙利算法匹配GT,获得正负样本;6.根据正负样本计算分类与回归loss。前两章,

文章图片
#深度学习#transformer#人工智能
    共 23 条
  • 1
  • 2
  • 3
  • 请选择