logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语义分割之FCN、Deeplab V3+

1、相关参考链接基本概念:语义分割三维语义分割空洞卷积两篇综述最新论文:LEDNet这里将语义分割网络分为两类:一类是以FCN为代表的“encode-decode”,另一类是以Deeplab为代表的“dilate convolution”(空洞卷积网络)。2、从FCN讲起FCN(Fully Convolutional Networks for Semantic Segmenta...

#算法
CASIA-HWDB2.x 数据集DGRL文件解析(python)

CASIA-HWDB 数据集是最常见的手写汉字识别数据集,它包含脱机、联机两部分,分单字、文本行两种类型:HWDB1.x:脱机单字,1.0~1.2 三个版本,数据格式为 .gntOLHWDB1.x:联机单字,1.0~1.2 三个版本,HWDB2.x:脱机文本行,1.0~1.2 三个版本,数据格式为 .dgrlOLHWDB1.x:联机文本行,1.0~1.2 三个版本,一般常用的汉字识别多为脱机单字识

目标检测之RCNN、Yolo、SSD、RetinaNet与Anchor-Free

1、RCNN系列1.1 从RCNN到Fast RCNN、Faster RCNN(1)RCNNObject Detection任务主要包含两个内容:识别物体,确定位置。在识别物体这一块,传统的做法是利用特征点来表征物体的类,例如:SIFT,SURF等;在CNN方法出现之后,普遍采用“卷积+池化+全连接”的方式来完成。而对于确定物体的位置,最流行的就是莫过于Region Proposal,在图像...

CASIA-HWDB2.x 数据集DGRL文件解析(python)

CASIA-HWDB 数据集是最常见的手写汉字识别数据集,它包含脱机、联机两部分,分单字、文本行两种类型:HWDB1.x:脱机单字,1.0~1.2 三个版本,数据格式为 .gntOLHWDB1.x:联机单字,1.0~1.2 三个版本,HWDB2.x:脱机文本行,1.0~1.2 三个版本,数据格式为 .dgrlOLHWDB1.x:联机文本行,1.0~1.2 三个版本,一般常用的汉字识别多为脱机单字识

评价度量指标之BLEU,METEOR,ROUGE,CIDEr

在 VTT (Video to Text) 任务中,需要衡量模型输出的视频描述语句的准确性,因为衡量的对象是一个个的自然语言文本,所以通常会选择自然语言处理领域的相关评价指标。这些指标原先都是用来度量机器翻译结果质量的,并且被证明可以很好的反映待评测语句的准确性,主要包含4种:BLEU,METEOR,ROUGE,CIDEr。1、BLEUBLEU(Bilingual Evaluation und..

准确率、召回率和mAP、AP50/75

1、准确率和召回率真实值与预测值之间的关系为:准确率(precision)和召回率(recall)作为统计值,各自的计算方式:P=TPTP+FPP=\frac{TP}{TP+FP}P=TP+FPTP​R=TPTP+FNR=\frac{TP}{TP+FN}R=TP+FNTP​准确率 PPP 给出了“预测为真值的样本中确实有多少比例为真值”,召回率 RRR 给出了“本来就是真值的样本模型预测出...

准确率、召回率和mAP、AP50/75

1、准确率和召回率真实值与预测值之间的关系为:准确率(precision)和召回率(recall)作为统计值,各自的计算方式:P=TPTP+FPP=\frac{TP}{TP+FP}P=TP+FPTP​R=TPTP+FNR=\frac{TP}{TP+FN}R=TP+FNTP​准确率 PPP 给出了“预测为真值的样本中确实有多少比例为真值”,召回率 RRR 给出了“本来就是真值的样本模型预测出...

到底了