logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《TDN: Temporal Difference Networks for Efficient Action Recognition》论文详解

论文地址:https://arxiv.org/abs/2012.10071代码地址:https://github.com/MCG-NJU/TDN该文章在2020年12月份发表于arxiv,文章提出了short-term TDM和long-sterm TDM模块来高效的获取local motion信息和global motion信息。从而在速度和精度上都取得了较好的成绩。一、网络结构网络结构如下图所

从新的角度看待大模型微调

一切要从最近大火的Lora()说起,该文章在ICLR2022中提出。说的是利用低秩适配(low-rank adaptation)的方法,可以在使用大模型适配下游任务时只需要训练少量的参数即可达到一个很好的效果。LoRA是怎么去微调适配下游任务的?流程很简单,LoRA利用对应下游任务的数据,只通过训练新加部分参数来适配下游任务。而当训练好新的参数后,利用重参的方式,将新参数和老的模型参数合并,这样既

文章图片
#深度学习#人工智能#LoRA
ControlNet论文详解

图片处理特定任务上的数据集规模较小,例如LAION-5B这种数据集是特殊领域图像处理数据集(100k)的5w倍图片处理任务还是靠数据驱动的,所以想要在特定的硬件资源和时间上快速的训练一个大网络是比较难的图像处理任务非常的多样,目前还没有一个灵活的方式将不同的任务采用end-to-end方式完成,还是不同的任务用不同的方式来适配任务本文提出一种方法可以使得大模型在特定领域的小数据集上训练而不会过拟合

文章图片
#人工智能#深度学习#python
Image captioning任务常用的评价指标计算

BLEU (bilingual evaluation understudy) ACL-2002Meteor AMTA-2004ROUGE-L ACL-2004CIDEr CVPR-2015SPICE ECCV-2016

#机器学习#机器翻译
TextBoxes与TextBoxes++算法详解

这是两篇文章,因为这两篇文章大部分是相同的所以写一块了。TextBoxes《TextBoxes: A Fast Text Detector with a Single Deep Neural Network》发表于AAAI2017github地址:https://github.com/MhLiao/TextBoxes这篇文章是借鉴SSD的网络用于文字检测,创新也不是太大。还有一点要清楚的...

#机器学习#算法
SENet(Squeeze-and-Excitation Networks)论文详解

《Squeeze-and-Excitation Networks》这篇文章在17年就发布在axiv上了,最近一次修改是2019年五月,最近看用的人还是蛮多的,可能是因为效果好而且使用简单吧。该网络其实可以理解为一个网络中的插件,可以和各种网络配合,如最基础的卷积层,resnet,inception等等。下面来看看它的实现原理。一、SE块(SQUEEZE-AND-EXCITATION BLOCK..

主流的视频动作类算法任务介绍

主流视频动作类算法任务介绍

#人工智能
《Mask2Former》算法详解

文章为发表在CVPR2022的一篇文章。从名字可以看出文章像提出一个可以统一处理各种分割任务(全景分割、语义分割、实例分割)的网络。

文章图片
#算法#人工智能#深度学习
    共 24 条
  • 1
  • 2
  • 3
  • 请选择