logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

显卡里的cuda真正做到并行运算的机制和线程个数,主要关于SM、warp等概念。

前面扯了很多,不过大多都是在讲CUDA 在软体层面的东西;接下来,虽然Heresy 自己也不熟,不过还是来研究一下硬体的部分吧~毕竟要最佳化的时候,好像还是要大概知道一下相关的东西的。这部分主要参考资料是:[Hotball'sHive]GPU 的硬体架构Programming Massively Parallel Processors的Lecture7在研究硬体架构前,

论cudnn与cuda之间的关系,和实际例子测试。

1、其中cudnn是一个常见的神经网络层加速库文件,其能够很大程度的把加载到显卡上的网络层数据进行优化计算。cuda就像一个傻大粗的加速库,其主要是依靠的是显卡计算速度跟一些算法的优化,而且其也是进行显卡加速的入口。所以cudnn需要在有cuda的基础上进行。2、下面是一些例子测试,从实际上可以看出cudnn可以在cuda基础上加速两倍以上:使用cuda但是没有使用cudnn:

深度学习知识八:深度学习里神奇的1*1卷积核

深度学习里神奇的1*1卷积核这里主要介绍下1*1卷积核的神奇之处核最好的使用范围,在开始之前需要了解下卷积网络的权值共享概念,其中权值共享基本上有两种方法:在同一特征图和不同通道特征图都使用共享权值,这样的卷积参数是最少的,例如上一层为30*30*40,当使用3*3*120的卷积核进行卷积时,卷积参数为:3*3*120个.(卷积跟mlp有区别也有联系一个神经元是平面排列,一个是线性排列)第二种只

Retinex、log对数变换、直方图均衡化区别,边缘增强Retinex算法与拉普拉斯算法联系、均衡化与亮度调节算法、大津阈值计算

1、其中Retinex算法具有的功能:动态范围压缩(即滤掉了低频部分,提取了高频)、色调再现(即还有图像色彩);      其中这个算法里使用了log对数域,这个主要原因不是为了扩展低灰度值,压缩高灰度值,而是为了避免负值的灰度值。是因为原图像直接减去滤波后的图像,可能会出现负值,处理麻烦,如果是装换到对数域的话,虽然相减也会有负值,但是在进行反对数变换的时候就一定是正值。下面的是多尺度Ret

Flask、django--如何在pycharm中导入并运行项目、flask出现即You did not provide the “FLASK_APP“报错解决

一.导入flask项目File-Open选择需要导入flask项目(如项目名为flasky)。二.设置解释器File-Settings-Project Interpreter,如下图所示三.添加Flask server1.点击pycharm右上角的Add Configuration2.点击+号,选择Flask Server3.填写参数4.运行项目点击pycharm右上角的运行按钮:在浏览器中输入访

#flask#python#pycharm
Linux/Centos Mondo 一键部署、镜像恢复,快速部署,跟使用vnc远程管理操作Ubuntu系统

一.简介Mondo Rescue是一个开源免费的故障恢复和备份工具,用户可以轻松地创建系统(Linux或Windows)克隆或备份的ISO镜像,可以将这些镜像存放在CD、DVD、磁带、USB设备、硬盘和NFS上。Mondo Rescue还可以用来快速恢复或者重新部署工作镜像到其他系统中,万一碰到数据丢失,你还可以从备份介质恢复尽可能完整的系统数据。Mondo Rescue(以下简称Mondo)..

总结|深度学习实现缺陷检测收集(参考论文,思路,代码)

前言缺陷检测是工业上非常重要的一个应用,由于缺陷多种多样,传统的机器视觉算法很难做到对缺陷特征完整的建模和迁移,复用性不大,要求区分工况,这会浪费大量的人力成本。深度学习在特征提取和定位上取得了非常好的效果,越来越多的学者和工程人员开始将深度学习算法引入到缺陷检测领域中,下面将会介绍几种深度学习算法在缺陷检测领域中的应用。A fast and robust convolutional ne...

pytorch实用工具:torchsummary、torchsnooper、显示tensor的vutils

一. torchsummmary工具:其主要是用来计算网络的计算参数等信息的,其大概的流程为:安装指令:pip install torchsummary使用方法:import torch, torchvisionmodel = torchvision.models.vggmodel = torchvision.models.vgg16()from torchsum...

文章图片
#pytorch#深度学习#机器学习
背景建模或前景检测之GMM

博客:背景建模或前景检测之GMM自己的工程代码在开源中国:GMM源代码+详细注释本文通过OpenCV来实现一种前景检测算法——GMM,算法采用的思想来自论文[1][2][4]。在进行前景检测前,先对背景进行训练,对图像中每个背景采用一个混合高斯模型进行模拟,每个背景的混合高斯的个数可以自适应。然后在测试阶段,对新来的像素进行GMM匹配,如果该像素值能够匹配其中一个高斯,

旋转向量与旋转矩阵的联系、点乘点积的意义、飞机的姿态角

1、旋转向量与旋转矩阵的联系:   处理三维旋转问题时,通常采用旋转矩阵的方式来描述。一个向量乘以旋转矩阵等价于向量以某种方式进行旋转。除了采用旋转矩阵描述外,还可以用旋转向量来描述旋转,旋转向量的长度(模)表示绕轴逆时针旋转的角度(弧度)。旋转向量与旋转矩阵可以通过罗德里格斯(Rodrigues)变换进行转换。OpenCV实现Rodrigues变换的函数为

    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择