
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
#include__global__ void childKernel(int i){int tid = blockIdx.x*blockDim.x+threadIdx.x;printf("parent:%d,child:%d\n",i,tid);for(int j=i;j<i+10;j++){printf(",%d",j);}printf("\n");
今天发现nsight这个神奇,是eclipse专门写cuda的IDE来的。但不幸总是崩溃IDE退出。出现这些英文错误提示:Java heap spacean internal error occurred during:update monitorunhandled event loop exception最后折腾了一下子,找到了解决方案.打开配置文件nsigh
这次遇到的问题是,编译原子性代码出错。代码是《GPU高性能编程cuda实践》第9章的hist_gpu_gmem_atomics.cu和hist_gpu_shmem_atomics.cu。这次还是用原有sdk带有makefile修改来编译。出现"/usr/local/cuda-5.5"/bin/nvcc-ccbin g++ -I../../../common/inc -m32
Cuda的编译运行 至今没有找到有现成的IDE可以一键编译运行cuda程序的,也只有用命令行或者makefile来编译了。 命令行编译看起来很复杂,makefile又不会写。 目前找到了这么一个可行的办法:修改sdk的makefile。 cuda安装后,会有一些自带的例子。samples里面的源代码,已带有makefile文件
给gpu一个1000大小的数组赋值,为了测量时间,
sklearn特征选择和分类模型数据格式:这里,原始特征的输入文件的格式使用libsvm的格式,即每行是label index1:value1 index2:value2这种稀疏矩阵的格式。 sklearn中自带了很多种特征选择的算法。我们选用特征选择算法的依据是数据集和训练模型。 下面展示chi2的使用例。chi2,采用卡方校验的方法进行特征选择,比较适合0/
我搞了个微信号(data_bird),关注大数据,数据挖掘,机器学习,深度学习。与大家共同与时俱进!
其中用到一个宏定义CUDA_KERNEL_LOOP在common.hpp中有。#defineCUDA_KERNEL_LOOP(i,n)\for(inti= blockIdx.x * blockDim.x + threadIdx.x; \ii +=blockDim.x * gridDim.x)先看看caffe采取的线程格和线程块的维数设计







