
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
街景字符编码识别比赛链接:https://tianchi.aliyun.com/competition/entrance/531795/information一、赛题数据训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置,测试集A包括4W张照片。二、初步方案由于主要偏向目标检测方向,所以首先使用mmdetection中的faster_rcnn训练一个
FCOS: Fully Convolutional One-Stage Object Detection,全卷积一阶目标检测,但是与经典的one_stage检测器,例如ssd,yolo不一样的是,FCOS摆脱了anchor框的限制,即anchor_free,本博文以mmdetection中的fcos代码为走向,来介绍这个检测器。一、网络整体框架二、feature map原图映射点,get_poin
python中的 * 和 ** ,能够让函数支持任意数量的参数,它们在函数定义和调用中,有着不同的目的。一、 打包参数* 的作用:在函数定义中,收集所有位置参数到一个新的元组,并将整个元组赋值给变量argsdef f(*tup1):# * 在函数定义中使用print(tup1)f() 结果:()f(1) 结果:(1,)f(1, 2, 3, 4) 结果:(1, 2, 3, 4)** 的作用:在函数定
一、PhotoMetricDistortion函数介绍:class PhotoMetricDistortion:"""Apply photometric distortion to image sequentially, every transformationis applied with a probability of 0.5. The position of random contrast
一、Pseudo Labeling这个链接解释Pseudo Labeling解释的很清楚,可以看一看什么是Pseudo Labeling:Pseudo Labeling就是将测试集中,测试结果中分数很高的测试图片,加入到训练集中,再训练。Pseudo Labeling的5个步骤:1、使用原始训练集,训练一个模型,这里最好是比较好的模型;2、使用该模型去测试你的测试集,这里一般是没有标签的测试集;3
深度学习之前,最成功的检测算法就是基于梯度直方图的目标检测算法,今天主要介绍一些这个算法的步骤:1、图像预处理(统一亮度,色彩强度)这样做是为了使图像不要太黑或者太亮,对比度不要太窄2、计算每一个像素点位置的梯度方向和大小下图是梯度的计算方式和梯度的可视化:从梯度的计算公式可以看出,梯度是带有方向的向量,它有自己的方向和大小,每个像素位置都可以计算自己的梯度,计算方法是,先计算x方向的梯度,即像素
pytorch和python有很多接口不是很熟悉,直接影响了阅读代码的速度,因此这里把一些遇到的接口的用法记录下来,方便下次直接快速的查找。文章目录1、numpy.clip(a, a_min, a_max, out=None) 限制数组最大值和最小值1、numpy.clip(a, a_min, a_max, out=None) 限制数组最大值和最小值a = np.arange(10)print
不用训练,直接用在ImageNet上训练的RestNet网络就可以做一个简单的以图搜图功能1、RestNet网络上面是resnet网络的结构图,ImageNet是一个有1000类的数据集,我们可以把在该数据集上训练过的Resnet网络当成特征提取器,用来提取图片的特征,然后比对特征的欧式距离,判定两种图片的相似性。average pool的输出是512x1x1,将其reshape为512x1当作该
1、经常使用pytorch的都知道,下面是pytorch加载自己数据的流程代码from torch.utils.data import Datasetfrom torch.utils.data import DataLoaderclass MyDataset(Dataset):def __init__(self)def __len__(self)def __getitem__(self, inde
如果PyTorch操作支持广播,则其Tensor参数可以自动扩展为相等大小(无需复制数据)如果满足以下规则,则两个张量是“可广播的”:1、每个张量具有至少一个维度。2、从尾随尺寸开始迭代尺寸时,尺寸要么相等,要么其中之一为1,或者不存在其中之一。...