logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SqueezeNet网络讲解

原文地址:https://zhuanlan.zhihu.com/p/31558773引言SqueezeNet是Han等提出的一种轻量且高效的CNN模型,它参数比AlexNet少50x,但模型性能(accuracy)与AlexNet接近。在可接受的性能下,小模型相比大模型,具有很多优势:(1)更高效的分布式训练,小模型参数小,网络通信量减少;(2)便于模型更新,模型小,客户端程序容易更新;...

[损失函数]Softmax求导

原文链接: https://blog.csdn.net/u014380165/article/details/79632950我们知道卷积神经网络(CNN)在图像领域的应用已经非常广泛了,一般一个CNN网络主要包含卷积层,池化层(pooling),全连接层,损失层等。虽然现在已经开源了很多深度学习框架(比如MxNet,Caffe等),训练一个模型变得非常简单,但是你对损失函数求梯...

【课程笔记】优秀课程笔记整理

【课程笔记】优秀课程笔记整理目录Coursera吴恩达《神经网络与深度学习》课程笔记1.神经网络与深度学习2. 优化深度神经网络3. 构建机器学习项目4. 卷积神经网络CNN5. 序列模型...

人脸关键点检测综述

本文转自:https://zhuanlan.zhihu.com/p/42968117人脸关键点人脸关键点检测是人脸识别和分析领域中的关键一步,它是诸如自动人脸识别、表情分析、三维人脸重建及三维动画等其它人脸相关问题的前提和突破口。近些年来,深度学习方法由于其自动学习及持续学习能力,已被成功应用到了图像识别与分析、语音识别和自然语言处理等很多领域,且在这些方面都带来了很显著的改善。因此,本文针对深.

[NLP]Attention机制与self-Attention机制

作者:张俊林链接:https://www.zhihu.com/question/68482809/answer/264632289来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中,都很容易遇到注意力模型的身影。所以,了解注意力机制的工作原理对于关...

到底了