
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
记录ubuntu下常用软件的安装,避免每次安装查询,包括一些常用的配置。
CPU主要用于串行运算;而GPU则是大规模并行运算。由于深度学习中样本量巨大,参数量也很大,所以GPU的作用就是加速网络运算。CPU算神经网络也是可以的,算出来的神经网络放到实际应用中效果也很好,只不过速度会很慢罢了。而目前GPU运算主要集中在矩阵乘法和卷积上,其他的逻辑运算速度并没有CPU快。
深度学习模型参数量与FLOPs计算工具介绍
显卡内部,有三级结构:网格(grid)、块(block)、线程(thread)。每个显卡只有很少的网格,一个核函数只能运行在一个网格中,而一个网格里有多个块,每个块包含了若干线程。kernel在device上执行时实际上是启动很多线程,一个kernel所启动的所有线程称为一个网格(grid),同一个网格上的线程共享相同的全局内存空间,grid是线程结构的第一层次,而网格又可以分为很多线程块(blo

深度学习模型参数量与FLOPs计算工具介绍
也看了不少softmax和交叉熵的文章了,不少文章对它们的来龙去脉做了比较清晰地梳理,有些文章讲得过于复杂,从信息量、相对熵(KL散度)讲到交叉熵,对于想要实际应用的同学来说,其实没有必要掌握它的来龙去脉,于是在此,对softmax和交叉熵的概念和公式进行简要说明,辅助以实际例子对它们具体说明。

深度学习模型参数量与FLOPs计算工具介绍
输入矩阵格式:四个维度,依次为:样本数、图像高度、图像宽度、图像通道数输出矩阵格式:与输出矩阵的维度顺序和含义相同,但是后三个维度(图像高度、图像宽度、图像通道数)的尺寸发生变化。权重矩阵(卷积核)格式:同样是四个维度,但维度的含义与上面两者都不同,为:卷积核高度、卷积核宽度、输入通道数、输出通道数(卷积核个数)...

记录ubuntu下常用软件的安装,避免每次安装查询,包括一些常用的配置。
工作中大部分时间在用win和ubuntu的双系统,虽然能应付大部分工作,但是遇到频繁切换环境时,还是比较烦的,所以乘着周末时间研究了一下WSL系统。1. windows环境设置打开开发者模式电脑桌面右键选择显示设置->搜索开发者设置->打开开发人员选项开关。如下图所示。启用子系统功能,控制面板->程序->程序和功能->启动或光比Windows功能->适用于Linux的Windows子系统。勾选之后








