
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
轻量级网络本文大纲squeezenet: 还没写…mobilenet v1:《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications》mobilenet v2:《MobileNetV2: Inverted Residuals and Linear Bottlenecks》mob...
目标检测loss一、faster rcnn:分为RPN和Fast rcnn两个部分,每个部分再分为分类和回归损失:RPN损失:L({pi},{ti})=1Ncls∑iLcls(pi,pi∗)+λ1Nreg∑ipi∗Lreg(ti,ti∗)\begin{aligned} L\left(\left\{p_{i}\right\},\left\{t_{i}\right\}\right)=\fra...
一、pytorch数据类型及类型转换0.pytoch中的数据类型Data typedtypeCPU tensorGPU tensor32-bit floating pointtorch.float32 or torch.floattorch.FloatTensortorch.cuda.FloatTensor64-bit floating pointtorch.float64 or torch.do
Dynamic Filter Networks《Dynamic Filter Networks》NIPS 2016论文链接:https://arxiv.org/abs/1605.09673一、目的卷积核参数训练完就是固定的,不够灵活,作者希望得到一个根据输入动态生成的过滤器。提出dynamic filter module(filter-generating network 、dynamic fil
滑动窗口最大值####题目描述给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值。例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值分别为{4,4,6,6,6,5}; 针对数组{2,3,4,2,6,2,5,1}的滑动窗口有以下6个: {[2,3,4],2,6,2,5,1}, {2,[3,4,2],6,2,5,1}, {2,3..
坐标系变换几个坐标系:世界坐标系(world coordinate system):用户定义的三维世界的坐标系,为了描述目标物在真实世界里的位置而被引入。单位为m。相机坐标系(camera coordinate system):在相机上建立的坐标系,为了从相机的角度描述物体位置而定义,作为沟通世界坐标系和图像/像素坐标系的中间一环。单位为m。图像坐标系(image coordinate...
立体视觉:立体视觉:立体视觉是计算机视觉领域的一个重要课题,它的目的在于重构场景的三维几何信息.其应用包括移动机器人的自主导航系统,航空及遥感测量,工业自动化系统等。双目立体视觉:双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法...
0.目录格式列举了几种常用写法,深度学习各种模型常用3中方法,#1:VIS/|-- bin/||-- vis||-- vis/||-- tests/|||-- __init__.py|||-- test_main.py||||-- __init__.py||-- main.py||-- docs/||-- ...
一、文本分类:用电脑对文本集(或其他实体或物件)按照一定的分类体系或标准进行自动分类标记。本实验从中国新闻网爬取了10类(财经、国际、It、健康、军事、能源、汽车、体育、文化、娱乐)共180多万篇新闻,经过分词、取名词、去掉停用词、计算tfidf降低维度、然后生成分类器的输入数据,采用朴素贝叶斯作为baseline,还用了svm和libsvm分类器来对这100万篇文章进行分类。然后输出分类结果和一
常用loss:L1:公式:L1=∑i=1n∣yi−f(xi)∣L1=\sum_{i=1}^{n}\left|y_{i}-f\left(x_{i}\right)\right|L1=i=1∑n∣yi−f(xi)∣导数:dL1(x)dx={1 if x≥0−1 otherwise \frac{\mathrm{d} L_{1}(x)}{\mathrm{...







