
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
图片处理特定任务上的数据集规模较小,例如LAION-5B这种数据集是特殊领域图像处理数据集(100k)的5w倍图片处理任务还是靠数据驱动的,所以想要在特定的硬件资源和时间上快速的训练一个大网络是比较难的图像处理任务非常的多样,目前还没有一个灵活的方式将不同的任务采用end-to-end方式完成,还是不同的任务用不同的方式来适配任务本文提出一种方法可以使得大模型在特定领域的小数据集上训练而不会过拟合

视频动作识别汇总介绍
图片处理特定任务上的数据集规模较小,例如LAION-5B这种数据集是特殊领域图像处理数据集(100k)的5w倍图片处理任务还是靠数据驱动的,所以想要在特定的硬件资源和时间上快速的训练一个大网络是比较难的图像处理任务非常的多样,目前还没有一个灵活的方式将不同的任务采用end-to-end方式完成,还是不同的任务用不同的方式来适配任务本文提出一种方法可以使得大模型在特定领域的小数据集上训练而不会过拟合

BLEU (bilingual evaluation understudy) ACL-2002Meteor AMTA-2004ROUGE-L ACL-2004CIDEr CVPR-2015SPICE ECCV-2016
这是两篇文章,因为这两篇文章大部分是相同的所以写一块了。TextBoxes《TextBoxes: A Fast Text Detector with a Single Deep Neural Network》发表于AAAI2017github地址:https://github.com/MhLiao/TextBoxes这篇文章是借鉴SSD的网络用于文字检测,创新也不是太大。还有一点要清楚的...
《Squeeze-and-Excitation Networks》这篇文章在17年就发布在axiv上了,最近一次修改是2019年五月,最近看用的人还是蛮多的,可能是因为效果好而且使用简单吧。该网络其实可以理解为一个网络中的插件,可以和各种网络配合,如最基础的卷积层,resnet,inception等等。下面来看看它的实现原理。一、SE块(SQUEEZE-AND-EXCITATION BLOCK..
主流视频动作类算法任务介绍
视频动作识别汇总介绍
文章地址:CIDEr: Consensus-based Image Description Evaluation代码地址(非官方,且代码实现的是CIDEr-D):https://github.com/tylin/coco-caption文章由微软和Virginia Tech联合发表在CVPR2015上。CIDEr是专门用来评价image captioning效果的评价指标。下面先定义一些符号。对于







