logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

cuda核函数再调用核函数,多层并行

#include__global__ void childKernel(int i){int tid = blockIdx.x*blockDim.x+threadIdx.x;printf("parent:%d,child:%d\n",i,tid);for(int j=i;j<i+10;j++){printf(",%d",j);}printf("\n");

eclipse for cuda(nsight)崩溃,出现 Java heap space,unhandled event loop exception错误

今天发现nsight这个神奇,是eclipse专门写cuda的IDE来的。但不幸总是崩溃IDE退出。出现这些英文错误提示:Java heap spacean internal error occurred during:update monitorunhandled event loop exception最后折腾了一下子,找到了解决方案.打开配置文件nsigh

#eclipse
cuda原子性操作代码编译问题 error: identifier "atomicAdd" is undefined

这次遇到的问题是,编译原子性代码出错。代码是《GPU高性能编程cuda实践》第9章的hist_gpu_gmem_atomics.cu和hist_gpu_shmem_atomics.cu。这次还是用原有sdk带有makefile修改来编译。出现"/usr/local/cuda-5.5"/bin/nvcc-ccbin g++ -I../../../common/inc -m32

cuda程序的编译运行

Cuda的编译运行        至今没有找到有现成的IDE可以一键编译运行cuda程序的,也只有用命令行或者makefile来编译了。        命令行编译看起来很复杂,makefile又不会写。        目前找到了这么一个可行的办法:修改sdk的makefile。      cuda安装后,会有一些自带的例子。samples里面的源代码,已带有makefile文件

gpu数组赋值各种方法性能测试

给gpu一个1000大小的数组赋值,为了测量时间,

sklearn特征选择和分类模型

sklearn特征选择和分类模型数据格式:这里,原始特征的输入文件的格式使用libsvm的格式,即每行是label index1:value1 index2:value2这种稀疏矩阵的格式。 sklearn中自带了很多种特征选择的算法。我们选用特征选择算法的依据是数据集和训练模型。 下面展示chi2的使用例。chi2,采用卡方校验的方法进行特征选择,比较适合0/

#数据挖掘#机器学习#sklearn
搞了个微信号,关注数据挖掘,机器学习

我搞了个微信号(data_bird),关注大数据,数据挖掘,机器学习,深度学习。与大家共同与时俱进!

#微信#机器学习#数据挖掘 +2
caffe源码分析--math_functions.cu代码研究

其中用到一个宏定义CUDA_KERNEL_LOOP在common.hpp中有。#defineCUDA_KERNEL_LOOP(i,n)\for(inti= blockIdx.x * blockDim.x + threadIdx.x; \ii +=blockDim.x * gridDim.x)先看看caffe采取的线程格和线程块的维数设计

#神经网络#机器学习#深度学习 +1
到底了