logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多目标融合参数搜索

权重分类目人群。

Transformer 代码详解

理论这篇文章看理论确实足够了!BERT大火却不懂Transformer?读这一篇就够了代码Multi-Head Attention这里分为两点,多头和自注意力class MultiHeadedAttention(nn.Module):def __init__(self, h, d_model, dropout=0.1):"Take in model size ......

#transformer
深度学习(二)梯度推导

梯度规则利用微分求梯度的方法计算量太大,而误差反向传播算法的出现提高了计算效率,误差反向传播算法主要基于链式法则,主要有以下几条规则。1.如果是由a + b = y,则反向传播时a b 的梯度相等,且等于y的梯度2.如果是a * b = y,则反向传播时a b 的梯度分别为b a,如果是矩阵运算会涉及到矩阵转换3.复杂的计算可以拆解成简单的元运算来计算梯度我们以全连接为例:y = xw + b首先

深度学习(二)梯度推导

梯度规则利用微分求梯度的方法计算量太大,而误差反向传播算法的出现提高了计算效率,误差反向传播算法主要基于链式法则,主要有以下几条规则。1.如果是由a + b = y,则反向传播时a b 的梯度相等,且等于y的梯度2.如果是a * b = y,则反向传播时a b 的梯度分别为b a,如果是矩阵运算会涉及到矩阵转换3.复杂的计算可以拆解成简单的元运算来计算梯度我们以全连接为例:y = xw + b首先

矩阵求导术

标量矩阵的求导,定义为∂f∂X=[∂f∂Xij]\frac{\partial f}{\partial X}=\left[\frac{\partial f}{\partial X_{ij}}\right]∂X∂f​=[∂Xij​∂f​]即fff逐元素求导排成与XXX相同的矩阵。一元微积分中的导数与微分的关系df=f′(x)dxdf=f'(x)dxdf=f′(x)dx,多元微积分中的梯度(标量对向量的

#矩阵#线性代数
Concurrent Spatial and Channel ‘Squeeze & Excitation’ in Fully Convolutional Networks(附代码)

文章目录摘要介绍方法空间压缩和信道激励(cSE)通道压缩和空间激励空间和通道的压缩和激励模块(scSE)摘要 全卷积网络为大量应用设置了图像分割的最新技术,F-CNN中的结构创新集中在空间编码或网络连接来帮助梯度流。本文,探索了一种自适应地重新校准特征图的方向,来增加有意义的特征,同时抑制弱的特征。我们从最近提出的squeeze & excitation(SE)模块获得灵感,该模块是用..

用狄拉克函数来构造非光滑函数的光滑近似

文章目录狄拉克函数在机器学习中,我们经常会碰到不光滑的函数,但我们的优化方法通常是基于梯度的,这意味着光滑的模型可能更利于优化(梯度是连续的),所以就有了寻找非光滑函数的光滑近似的需求。事实上,本博客已经多次讨论过相关主题,比如《寻求一个光滑的最大值函数》、《函数光滑化杂谈:不可导函数的可导逼近》等,但以往的讨论在方法上并没有什么通用性。不过,笔者从最近的一篇论文《SAU: Smooth acti

#概率论#深度学习#机器学习
The Lovasz-Softmax loss: A tractable surrogate for the optimization of the ´ intersection-over-union

文章目录1.简介2.子模损失函数的优化替代前景-背景分割多分类语义分割3.并集上的交集优化1.简介关于简介请参考Lovasz-Softmax loss2.子模损失函数的优化替代为了在连续优化框架中优化Jaccard,我们考虑了这种离散损失的平滑扩展。扩展是基于集合函数的子模分析,其中集合函数是从一组预测失误的集合映射到真实数据的集合。对于一个分割结果y∗y*y∗和真实值yyy我们定义类别...

MutableHashTable 使用

MutableHashTable字面意思理解是一个动态的hashmap,初始化时确认key和value,提供lookup调用将key值替换为valueimport tensorflow as tffrom tensorflow.contrib.lookup.lookup_ops import MutableHashTablefrom tensorflow.python.framework impo

#tensorflow
    共 30 条
  • 1
  • 2
  • 3
  • 请选择