logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

cuda 矩阵乘法,从最容易理解到算得最快(第二版源码-tile机制+共享内存)

下面我们仅仅引入tiling方法,先分析一下能够减少多少次对全局存储区的访问。当M=N=K=4096时,用第一版的代码,忽略cache的缓存时,需要从全局存储区读取2*(4096^3)个float变量。

#线性代数#机器学习#算法
VS Visual Studio 2017 创建cuda项目编译不过

当安装了较旧的cuda驱动,相对较新的visual studio 时,可能会出现cuda驱动中的配置文件不能识别Visual Studio的版本,而导致编译不过。以VS2017为例子,有多个版本号。当cuda驱动发布时间早已其中的某个版本号时,就无法识别VS的版本。只要手动改一下即可。例如cuda 9.2.148对VS2017的支持,仅仅到 (Visual Studio 2017 version

#深度学习
源码编译risc-v虚拟机和编译器 riscv-gnu-toolchain 和 riscv-tools 在ubuntu 22.04

4. 指定架构 rv64gc_zifencei。用如下编译器指示语句包一下。-1. 设置了PATH。第一行加入RISCV。2. 忘记包含头文件。3. 忘记包含头文件。

文章图片
#gnu#服务器
国内android源码下载网站

按照各种研究android书籍上介绍的方法去下载Android源码。会遇到一个严重的问题,那就是Google无法访问,据说是墙到了。在网上发现清华大学的镜像非常不错,于是整理一下用清华镜像作为源下载Android源码的方法。编译环境为了编译安卓源码,首先需要一个Linux,本次采用Ubuntu Kylin14.04,内核版本3.13。装在四核、4G内存、120G硬盘的虚拟机上(光源

纯命令行在Ubuntu中安装qemu的ubuntu虚拟机,成功备忘

启动虚拟机,不知道如何去掉 -cdrom 等选项,所以关闭终端,重开一个终端即可。

文章图片
#linux
OpenJDK 64-Bit Server VM warning: INFO: os::commit_memory(...)failed; error='...' (errno=12)

一. 原因发生在Linux Ubuntu上,运行或编译占用内存巨大的大软件大项目的过程中可能会出现 errno12 :Cannot allocate memory。原因应为内存不足,可以尝试增加内存条,可以尝试创建或增加swap的空间。如果算法是自己编写的我的机器用的是swapfile,而不是独立的swap分区,所以修改起来比较方便。二 . 解决1.观察...

cutlass 第一节:下载 编译 运行 cutlass 的一些备忘信息 ubuntu docker

—————v100———cutlass—start———————————————————————————————————————————__________web site__________________________________________________https://developer.nvidia.com/blog/cutlass-linear-algebra-cuda/ht

#ubuntu#docker#linux
备忘一下,vulkan android sample 编译错误:ninja: error: libshaderc.a', needed by

又要编译vulkan-API-Sample,每次找这行命令要用很久,备个忘不编译shaderc的对应的编译错误为:Build command failed.Error while executing process C:\Users\honglei.li\AppData\Local\Android\Sdk\cmake\3.6.4111459\bin\cmake.exe with argu...

    共 22 条
  • 1
  • 2
  • 3
  • 请选择