lingerlanlan 个人主页

@linger2012liu

lingerlanlan

2023-10-25 11:44:35 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

神经网络：caffe特征可视化的代码样例

不少读者看了我前面两篇文章总结一下用caffe跑图片数据的研究流程deep learning实践经验总结2--准确率再次提升，到达0.8，再来总结一下之后，想知道我是怎么实现特征可视化的。

#caffe #神经网络 #深度学习

gpu数组赋值各种方法性能测试

给gpu一个1000大小的数组赋值，为了测量时间，

cuda核函数再调用核函数，多层并行

#include__global__ void childKernel(int i){int tid = blockIdx.x*blockDim.x+threadIdx.x;printf("parent:%d,child:%d\n",i,tid);for(int j=i;j<i+10;j++){printf(",%d",j);}printf("\n");

数组求和的快速方法（利用cuda的共享内存）--第三部分之性能分析

测试的是

eclipse for cuda(nsight)崩溃，出现 Java heap space,unhandled event loop exception错误

今天发现nsight这个神奇，是eclipse专门写cuda的IDE来的。但不幸总是崩溃IDE退出。出现这些英文错误提示：Java heap spacean internal error occurred during:update monitorunhandled event loop exception最后折腾了一下子，找到了解决方案.打开配置文件nsigh

#eclipse

cuda原子性操作代码编译问题 error: identifier "atomicAdd" is undefined

这次遇到的问题是，编译原子性代码出错。代码是《GPU高性能编程cuda实践》第9章的hist_gpu_gmem_atomics.cu和hist_gpu_shmem_atomics.cu。这次还是用原有sdk带有makefile修改来编译。出现"/usr/local/cuda-5.5"/bin/nvcc-ccbin g++ -I../../../common/inc -m32

cuda程序的编译运行

Cuda的编译运行至今没有找到有现成的IDE可以一键编译运行cuda程序的，也只有用命令行或者makefile来编译了。命令行编译看起来很复杂，makefile又不会写。目前找到了这么一个可行的办法：修改sdk的makefile。 cuda安装后，会有一些自带的例子。samples里面的源代码，已带有makefile文件

caffe源码分析--math_functions.cu代码研究

其中用到一个宏定义CUDA_KERNEL_LOOP在common.hpp中有。#defineCUDA_KERNEL_LOOP(i,n)\for(inti= blockIdx.x * blockDim.x + threadIdx.x; \ii +=blockDim.x * gridDim.x)先看看caffe采取的线程格和线程块的维数设计

#神经网络 #机器学习 #深度学习 +1

到底了