logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python, CuPy 与 cupyx 入门到实战

CuPy 是由 Preferred Networks 开发、基于 NVIDIA CUDA/AMD ROCm 的开源 GPU 数组计算库,最初为深度学习框架 Chainer 后端,如今已是 NumFOCUS 赞助的主流高性能计算项目。核心定位:NumPy 的 GPU 镜像,API 高度兼容,原有 NumPy 代码几乎无需改动即可迁移至 GPU。核心优势:无缝代码迁移、极致运算加速、完整覆盖多维数组、

#python
Python, CuPy 与 cupyx 入门到实战

CuPy 是由 Preferred Networks 开发、基于 NVIDIA CUDA/AMD ROCm 的开源 GPU 数组计算库,最初为深度学习框架 Chainer 后端,如今已是 NumFOCUS 赞助的主流高性能计算项目。核心定位:NumPy 的 GPU 镜像,API 高度兼容,原有 NumPy 代码几乎无需改动即可迁移至 GPU。核心优势:无缝代码迁移、极致运算加速、完整覆盖多维数组、

#python
问deepseek: 用mpi并行实现向量内积计算,效率最高的,用AVX-512

使用MPI并行计算向量内积并结合AVX-512指令集可以显著提高计算效率。

问deepseek: 如何把CGNS网格文件数据转换成OpenFOAM的PolyMesh数据,处理边界patch信息,处理zone-zone之间链接信息, 请用代码实现

将CGNS网格文件转换为OpenFOAM的PolyMesh数据涉及多个步骤,包括读取CGNS文件、提取网格信息、处理边界条件、处理zone-zone之间的链接信息,并最终生成OpenFOAM所需的PolyMesh文件。以下是一个Python脚本的示例,使用cgns库读取CGNS文件,并使用foamFile库生成OpenFOAM的PolyMesh文件。

#DeepSeek
问deepseek: HYPRE BoomerAMG 有哪些参数可以进行性能调优

Hypre BoomerAMG 是一个高性能的多重网格预条件子,常用于求解大规模稀疏线性系统。

问deepseek: openfoam并行分区,数据交换逻辑解释

OpenFOAM的并行分区和数据交换通过将计算域分解为子域,并在处理器边界上进行数据交换来实现。数据交换通过MPI完成,确保各子域间的数据一致性。理解这一逻辑有助于优化并行计算的性能和准确性。

#DeepSeek
问deepseek: k-epsilon湍流模型,公式原理推导

k-ε湍流模型是一种广泛应用于工程湍流模拟的两方程模型,主要用于描述湍流动能(k)和湍流耗散率(ε)的输运过程。以下是k-ε模型的基本公式推导过程。

#DeepSeek
问deepseek:如何合理使用__builtin_prefetch函数提高cache使用效率和程序性能,有哪些指导原则,请写示例代码说明

是 GCC 提供的一个内置函数,用于在数据被实际使用之前将其预取到缓存中,从而提高缓存命中率和程序性能。合理使用可以减少内存访问的延迟,特别是在处理大数据集或复杂数据结构时。

#c语言#c++#数据结构
问deepseek: PBiCGSTAB是如何实现的,写段Fortran示例代码

PBiCGSTAB(Preconditioned Bi-Conjugate Gradient Stabilized)是一种用于求解大型稀疏线性方程组的迭代方法。它是BiCGSTAB算法的改进版本,通过引入预处理技术来加速收敛。PBiCGSTAB算法通常用于求解非对称线性方程组。

问deepseek: 如何用CUDA实现PBiCGSTAB稀疏矩阵迭代算法,写段示例代码

PBiCGSTAB是一种用于求解大型稀疏线性方程组的迭代算法。初始化预处理迭代求解收敛判断。

    共 186 条
  • 1
  • 2
  • 3
  • 19
  • 请选择