logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于 Householder 变换的 qr 分解 算法与源码实现

计算 Householder 向量给定算法计算满足 v(1) = 1.0 的和, 使得是正交矩阵且, 即,将m维向量通过反射变换反射至轴上去。

文章图片
#算法#HPC
Win10 编译运行Fortran77程序,开发环境搭建

有个朋友说我讲的blas中的fortran语法有个地方不正确,非说他自己的理解是对的。我说你拿出证据来才行。他说自己不知道怎么编译f77程序——好吧,那还这么自信呀^^首先,可以使用intel的 parallel studio套件来编译运行f77;其次,如果嫌intel的套件太大了,可以任何当前版本的gfortran编译f77程序。既可以使用较流行的code blocks 内部配搭MinGW,也可

UEFI 01记: 开发环境 在 ubuntu22 中搭建 edk2 开发环境并运行简单示例

过程非常顺利,没有遇到任何问题,做一下信息记录,备查。

文章图片
Latex 算法模版整理

【代码】Latex 算法模版整理。

文章图片
#算法#开发语言
从源码安装 python 3.12 步骤

建议通过 update-alternatives 管理多版本,而非直接替换系统 Python。确保使用 sudo 或指定用户可写的 --prefix(如 $HOME/.local)。安装依赖时遗漏 libffi-dev,重新安装后重新编译。(或者将 3.12.0 替换为自己需要的版本号):生成共享库(.so 文件,供其他程序链接)。如果安装了多个 python,可以选择当前版本。=install:

文章图片
#python#开发语言
高性能网络的网络拓扑介绍:nd-Mesh、Torus、Clos

特性nd-mesh(n维网格)Clos Network(叶脊网络)Torus(环面)核心形象城市的街道网格公司的汇报层级(全员互联)魔方(每个面首尾相连)对称性差好(逻辑对称)极好(物理对称)对分带宽低极高中到高扩展性中等极佳中等典型领域早期超算、片上网络现代数据中心/云高性能计算设计哲学简单、规整、成本可控无阻塞、高带宽、弹性扩展均匀延迟、高容错、高效通信。

Blackwell 和 Hopper 架构的 GPGPU 新功能全面综述

Blackwell 和 Hopper 架构通过 TMA、集群共享内存、增强的 FP8 支持等功能,显著提升了 GPU 的计算能力和效率。这些新特性特别适合现代 AI 和高性能计算工作负载,能够提供更高的性能和能效比。开发者可以通过合理利用这些新功能来优化现有应用程序或开发新的高性能计算解决方案。请注意,要运行这些示例代码,需要:支持 Hopper 或 Blackwell 架构的 GPUCUDA 1

#架构
NVidia 的 gpu 开源 Linux Kernel Module Driver 编译 安装 使用

按照nv官方步骤,先执行step1的安装。

文章图片
    共 104 条
  • 1
  • 2
  • 3
  • 11
  • 请选择