logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

cuda 下载和文档 cuda documents and download archive

cuda toolkits download:CUDA Toolkit Archive | NVIDIA DeveloperPrevious releases of the CUDA Toolkit, GPU Computing SDK, documentation and developer drivers can be found using the links below. Please s

#深度学习#caffe#pytorch
Chisel 教程翻译 之 第五章:组合逻辑电路 of《Digital Design with Chisel》

5 Combinational Building Blocks 435.1 Combinational Circuits . . . . . . . . . . . . . . . . . . . . . . . . . . 435.2 Decoder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455.3 E

玩转gpgpu-sim 04记—— __cudaRegisterBinary() of gpgpu-sim 到底做了什么

GPGPUSim_Context()->get_device()->get_gpgpu()->get_config().use_cuobjdump() 表示什么含义。

文章图片
玩转 gpgpu-sim 03记 —— 建立源代码感性体验

跟踪 顶层 Makefile 和 setup_environment 的代码可以看出来,如果跟上一个参数 “debug” 来运行 source setup_environment debug,那么就会编译一个debug版本的 gpgpu-sim;根据输出信息知道,这里的cudaMalloc是在文件 at cuda_runtime_api.cc:424 行中,vectorAdd.cu 的源代码中,第

文章图片
测试 cuda gpu 一秒钟能launch 多少次 kernel

启动100000次带参数的空 kernel, 总耗时124ms;

文章图片
玩转 gpgpu-sim 01记 —— try it

gpgpu-sim 是一个gpu模拟器,可以让cuda/openCL程序运行在一个软件模拟器上,而不需要硬件GPU;

文章图片
编译 amd gpu 核心态驱动 rocm kmd linux kernel

AMD 开源了专门的 ROCm 的kmd Linux Kernel,

文章图片
#linux
AMD hipcc 生成各个gpu 微架构汇编语言代码的方法示例

为了简化逻辑,故假设 vector 的 size 与运行配置的thread个熟正好一样多,比如都是512之类的.

文章图片
#算法
玩转 gpgpu-sim 02记 —— 构建了什么

编译gpgpu-sim 需要先运行脚本 setup_environment , source setup_environment, 注释如下,主要是设置一些 Makefile中会用到的环境变量。示例程序 RAY 运行时 调用了 gpgpu-sim 的什么内容。非常短,加注释从共200多行。

文章图片
    共 28 条
  • 1
  • 2
  • 3
  • 请选择