Michaelliu_dev 个人主页

@liuxiaoheng1992

Michaelliu_dev

2023-05-18 15:20:07 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ControlNet论文详解

图片处理特定任务上的数据集规模较小，例如LAION-5B这种数据集是特殊领域图像处理数据集（100k）的5w倍图片处理任务还是靠数据驱动的，所以想要在特定的硬件资源和时间上快速的训练一个大网络是比较难的图像处理任务非常的多样，目前还没有一个灵活的方式将不同的任务采用end-to-end方式完成，还是不同的任务用不同的方式来适配任务本文提出一种方法可以使得大模型在特定领域的小数据集上训练而不会过拟合

#人工智能 #深度学习 #python

视频时序动作识别（video action recognition）介绍

视频动作识别汇总介绍

#深度学习 #人工智能

ControlNet论文详解

#人工智能 #深度学习 #python

Image captioning任务常用的评价指标计算

BLEU (bilingual evaluation understudy) ACL-2002Meteor AMTA-2004ROUGE-L ACL-2004CIDEr CVPR-2015SPICE ECCV-2016

#机器学习 #机器翻译

TextBoxes与TextBoxes++算法详解

这是两篇文章，因为这两篇文章大部分是相同的所以写一块了。TextBoxes《TextBoxes: A Fast Text Detector with a Single Deep Neural Network》发表于AAAI2017github地址：https://github.com/MhLiao/TextBoxes这篇文章是借鉴SSD的网络用于文字检测，创新也不是太大。还有一点要清楚的...

#机器学习 #算法

SENet(Squeeze-and-Excitation Networks)论文详解

《Squeeze-and-Excitation Networks》这篇文章在17年就发布在axiv上了，最近一次修改是2019年五月，最近看用的人还是蛮多的，可能是因为效果好而且使用简单吧。该网络其实可以理解为一个网络中的插件，可以和各种网络配合，如最基础的卷积层，resnet，inception等等。下面来看看它的实现原理。一、SE块（SQUEEZE-AND-EXCITATION BLOCK..

视频时序动作检测（temporal action detection）介绍

视频时序动作检测

#深度学习 #计算机视觉 #人工智能

主流的视频动作类算法任务介绍

主流视频动作类算法任务介绍

#人工智能

视频时序动作识别（video action recognition）介绍

视频动作识别汇总介绍

#深度学习 #人工智能

Image captioning评价方法之CIDEr

文章地址：CIDEr: Consensus-based Image Description Evaluation代码地址（非官方，且代码实现的是CIDEr-D）：https://github.com/tylin/coco-caption文章由微软和Virginia Tech联合发表在CVPR2015上。CIDEr是专门用来评价image captioning效果的评价指标。下面先定义一些符号。对于

#机器学习 #机器翻译

共 18 条

请选择