
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
论文地址:Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification文章中提到使用双向的LSTM(Bidirectional LSTM)加上Attention的机制处理文本分类的相关问题,以解决CNN模型不适合学习长距离的语义信息的问题。1. 网络结构在Attention...
相比较于图像分类来说,目标检测(Object Detection)不仅需要标记出图像中的物体(通常使用边框标记),同时需要指出该物体是什么。一般比较直观的想法包括以下的三个步骤:得到候选区域;提取候选区域的特征;对该候选区域分类;RCNN(Region with CNN features),又称为基于区域的卷积神经网络,也是基于上述的思路的一种目标检测的方法,基本的思路如下图所示:...
1. 概述2. 算法原理参考文献Chen Q , Zhao H , Li W , et al. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba[J]. 2019.阿里推荐算法(BST): 将Transformer用于淘宝电商推荐
在NIN卷积网络中,有两个点优化,第一,在传统的卷积层中加入MLP,进一步提升局部特征的提取能力;第二,引入全局平均聚合,将feature map与最终的分类类目对应,缓解因全连接网络引起的过拟合。
1. 概述在循环神经网络RNN一文中提及到了循环神经网络RNN存在长距离依赖的问题,长短期记忆(Long Short-Term Memory,LSTM)网络便是为了解决RNN中存在的梯度爆炸的问题而提出。在LSTM网络中,主要依靠引入“门”机制来控制信息的传播。2. 算法原理2.1. LSTM的网络结构LSTM的网络结构如下所示(图片来自参考文献):与循环神经网络RNN相比,LSTM的网络结构要复
1. 概述循环神经网络(Recurrent Neural Networks, RNN)主要用于时序数据,最常见的时序数据如文章,视频等,ttt时刻的数据与t−1t-1t−1时刻的数据存在内在的联系。RNN模型能够对这样的时序数据建模。2. 算法原理RNN模型的基本结构如下所示(图片来自参考文献):如上图所示,循环神经网络通过使用自带反馈的神经元,能够处理任意长度的时序数据,对此结构按照时间展开的形
相比较于图像分类来说,目标检测(Object Detection)不仅需要标记出图像中的物体(通常使用边框标记),同时需要指出该物体是什么。一般比较直观的想法包括以下的三个步骤:得到候选区域;提取候选区域的特征;对该候选区域分类;RCNN(Region with CNN features),又称为基于区域的卷积神经网络,也是基于上述的思路的一种目标检测的方法,基本的思路如下图所示:...
1. 概述生成对抗网络GAN(Generative adversarial nets)[1]是由Goodfellow等人于2014年提出的基于深度学习模型的生成框架,可用于多种生成任务。从名称也不难看出,在GAN中包括了两个部分,分别为”生成”和“对抗”,整两个部分也分别对应了两个网络,即生成网络(Generator)GGG和判别网络(Discriminator)DDD,为描述简单,以图像生成为例
在TinyBERT中,精简了BERT模型的大小,设计了三种层的蒸馏,分别为transformer-layer,embedding-layer以及prediction-layer。同时,为了能够对以上三层的蒸馏,文中设计了两阶段的训练过程,分别与BERT的训练过程对应,即预训练和fine-tunning。







