社区云

HPC

华为云开发者联盟来自深开鸿技术专区

kaihong.csdn.net · 2020-04-01 11:25:42

性能优化挑战重重，鲲鹏 HPC 如何突破算力桎梏？

比起高性能计算（High Performance Computing，缩写 HPC），很多人对“超级计算机”感觉更熟悉一些。但事实上，超级计算机就是 HPC 系统的最尖端水平。在全球超级计算机 TOP500 中，位列榜首的美国橡树岭国家实验室的“顶点”系统，其浮点运算速度为每秒 14.86 亿亿次。而这份榜单的入围门槛也是达到了每秒 1.14 千万亿次的运算速度。如此强大的计算能力，究竟能为技..

#华为云 #云计算 #人工智能 +1

7636 

3 
骥龙来自 2048 AI社区

2048ai.net · 2026-01-29 18:03:40

第三篇、存储系统设计：当PB级基因组数据遇上AI训练集

当我们豪掷千万购置顶级GPU，部署200G超高速网络，却因一个小小的SATA SSD选择，让整个系统的实际性能只剩下理论值的30%——元数据性能，这个最容易被忽视的细节，正在成为医疗超算平台的“阿喀琉斯之踵”。

#人工智能 #网络 #HPC

711 

14 
weixin_42849849 来自火山引擎 ADG 社区

adg.csdn.net · 2025-12-03 09:34:25

Overture：面向对象的 C++ 软件框架，复杂几何（包括运动几何）求解PDE

它由一系列可移植、模块化的 C++ 库组成，适用于使用。：整个框架以库的形式提供，可灵活集成到新项目或已有代码中。：支持与非结构化网格耦合，用于多尺度或多物理场问题。这些求解器均为开源，可直接使用或作为开发模板。：提供从 CAD 几何自动构建计算网格的能力。，使开发者能更专注于物理建模与算法逻辑。（FVM）进行数值模拟的场景，同时。Overture 之上构建了名为。Overture 是一个。

#HPC

534 

14 
weixin_42849849 来自 2048 AI社区

2048ai.net · 2026-01-18 08:30:03

Roofline性能模型介绍, Intel Advisor使用建模

步骤目标1. 编写可测程序包含热点循环2. 使用 Advisor 采集 tripcounts + FLOP获取 AI 和性能3. 查看 Roofline 图判断是内存还是计算受限4. 针对性优化内存受限 → 提高局部性；计算受限 → 向量化/并行化5. 迭代验证用 Advisor 对比优化前后效果通过 Roofline 模型 + Intel Advisor，可系统化地指导 HPC 程序优化，避免“

#HPC

747 

21 
weixin_42849849 来自 2048 AI社区

2048ai.net · 2026-01-07 15:03:57

Dakota: Design Analysis Kit for Optimization and Terascale Applications

Dakota（Design Analysis Kit for Optimization and Terascale Applications）是由 Sandia 国家实验室开发的一套开源软件框架，专注于优化（Optimization）、不确定性量化（Uncertainty Quantification, UQ）、参数化分析（Parametric Analysis）以及模型校准（Model C

#HPC

698 

19 
weixin_42849849 来自火山引擎 ADG 社区

adg.csdn.net · 2025-07-29 11:56:49

KDTree on GPU

需求推荐方案高维向量（如 embedding）近邻搜索✅低维空间（如 3D 点云）批量 k-NN✅cuML或学习 GPU 上 k-d tree 实现⚠️GKDTree（实验性）实时、高性能 ANN 搜索✅或HNSW🔔建议：除非你有特殊需求（如必须使用精确 k-d tree），否则不要在 GPU 上实现传统 k-d tree。使用FAISS或cuML等现代库更高效、稳定。

#HPC

1234 

9 
weixin_42849849 来自火山引擎 ADG 社区

adg.csdn.net · 2025-04-21 11:26:58

使用Intel VTune Profiler分析程序

Intel VTune Profiler是一款强大的性能分析工具，可以帮助开发者识别和优化应用程序的性能瓶颈。以下是使用VTune的基本步骤：下载安装：环境准备：常用分析类型：识别CPU使用率最高的函数查看调用树和热点路径内存分析检测内存分配/释放模式识别内存泄漏和内存带宽瓶颈线程分析分析线程并行效率检测锁争用和负载不平衡结果解读Summary视图：总体性能指标概览Bottom-up视图：按函数显

#HPC

1125 

15 
毅硕科技来自 2048 AI社区

2048ai.net · 2025-12-16 15:32:44

毅硕HPC | NVIDIA DGX Spark 万字硬核评测：将AI超级工厂带上桌面

作为全球首款基于NVIDIA Grace Blackwell架构的个人AI超级计算机，DGX Spark将工业级的AI性能带入您的私人工作空间，让您从原型设计到大规模部署，实现真正的无缝衔接。NVIDIA DGX Spark 不仅仅是硬件的升级，更是开发范式的革新。它将数据中心的强大能力浓缩于 1.2 公斤的精致机身中，赋予了每一位 AI 探索者在本地掌控未来的能力。

#HPC #功能测试 #spark

876 

16 
神工坊来自鲲鹏昇腾开发者社区

hwcomputing.csdn.net · 2025-10-30 09:54:26

仿真干货｜云端CAE实战案例——Workbench战斗机流固耦合分析

本文将向您介绍如何在SimForge™高性能仿真平台通过软件原生界面操作方式使用Workbench软件对某战斗机流固耦合分析，并能够充分调用超算HPC资源，实现大规模高效仿真求解。

#云平台 #HPC

730 

13 
weixin_42849849 来自鲲鹏昇腾开发者社区

hwcomputing.csdn.net · 2025-08-28 11:46:09

Kratos多物理场仿真平台

Kratos Multiphysics 是一个通用的多物理场仿真框架，允许用户在同一平台上耦合多个物理场（如结构力学、流体力学、热传导、电磁场、地质力学等）进行数值模拟。开源：基于 BSD 许可证，可自由使用和修改。多语言支持：核心用 C++ 实现，接口通过 Python 脚本控制，便于用户快速开发。模块化设计：支持“应用程序”（Applications）插件机制，每个物理场或求解器以独立模块形式

#HPC

1124 

28 
weixin_42849849 来自开源鸿蒙跨平台开发者社区

openharmonycrossplatform.csdn.net · 2025-12-03 14:44:40

PETSc: PCMPI介绍和使用

【代码】PETSc: PCMPI介绍和使用。

#HPC

439 

3 
weixin_42849849 来自 2048 AI社区

2048ai.net · 2025-12-02 10:30:59

Chombo：AMR结构化网格PDE求解框架介绍

特性说明结构化网格仅支持矩形块（Box），不支持非结构网格AMR 支持强大，但也可完全关闭用于静态网格并行能力基于 MPI + domain decomposition数据布局是核心容器I/O支持 HDF5 格式输出（通过语言C++（模板-heavy，需熟悉 RAII 和句柄模式）

#HPC

953 

20 
weixin_42849849 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-05-16 17:02:39

Recycling Krylov Subspace 方法解释与开源实现

Recycling Krylov Subspace（循环Krylov子空间）方法是迭代求解线性方程组时提高效率的一种技术，特别适用于需要连续求解多个相关线性系统的情况。

#HPC

676 

3 
猿代码科技来自 DAMO开发者矩阵

damodev.csdn.net · 2023-06-22 12:03:16

高性能计算和超算有什么区别？

而超级计算（Supercomputing）是高性能计算的一个特定领域，强调在计算能力方面的极致性能和应用于需要大规模并行计算的复杂问题。超级计算系统通常拥有巨大的规模、专门的硬件和软件架构，用于处理最具挑战性的计算任务。超级计算（Supercomputing）是高性能计算的一个子领域，指的是使用最强大、最先进的计算机系统来解决具有极高计算需求的问题。它们通常采用高度定制化的硬件架构，例如特殊的处理

#系统架构 #人工智能 #HPC

2901 
weixin_42849849 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-09-04 15:40:59

OpenMP : 进行多线程并行编程时，如何合理设置线程数和 CPU 亲和性，以充分发挥计算工作站的性能

项目推荐设置线程数计算密集型：物理核心数；避免盲目启用超线程NUMA 管理尽量让线程和内存在同一个 NUMA 节点亲和性使用或固定线程到核心编译器Intel 编译器对 OpenMP 优化更好；GCC 需手动调优测试验证通过perfnumastatlscpu验证性能和绑定效果。

#HPC

1390 

22 
papaofdoudou 来自 DAMO开发者矩阵

damodev.csdn.net · 2021-07-24 10:58:01

高性能计算(HPC)和智能计算理解

1.现代终端设备一般都跟云端服务器相连，但只要可能，我们都希望计算可以在本地终端解决，这样做的好处是多方面的：既可以减小网络带宽的压力，又可以避免网络传输产生的时延，还可以让用户的数据更安全。现代终端设备一般用一个片上系统 (SoC)做计算，上面部署了通用的CPU和集成显卡。对于日益增多的卷积神经网络推理计算来说，在移动端的CPU（多数ARM，少数x86）上虽然优化实现相对简单（参见我们对CPU的

#HPC

6888 

9 
Altair澳汰尔来自 2048 AI社区

2048ai.net · 2025-11-24 16:36:13

行业热点丨从 “算力供给” 到 “智能驱动”：Agentic HPC 开启创新范式

高性能计算（HPC）领域的创新，往往在幕后悄然发生。算法、工作流与自动化技术的渐进式优化，日积月累终成显著突破。这些改进或许并非一目了然，却能精简运营流程、减少瓶颈阻碍，让研究人员与管理人员得以专注探索创新，而非耗费精力于系统维护。随着人工智能驱动方案的介入，下一次飞跃已然来临——具备自主适应、优化与决策能力的系统，正不断放大这份“隐形的创新力量”。

#AI #HPC #云计算 +1

684 

11 
狂小虎来自 EazyDevelop社区

eazydevelop-community.eazytec-cloud.com · 2021-12-09 15:05:28

sbatch: error: Batch script contains DOS line breaks (\r\n)解決

在使用学校HPC集群时，发现win10写的batch任务报错，用dos2unix可解决。

#batch #r语言 #开发语言 +1

6009 

12 
高性能服务器来自九章云极普惠算力

datacanvas.csdn.net · 2024-12-23 15:19:41

《异构计算：多元算力聚变，点燃高性能计算新引擎 – CPU、GPU与FPGA算力融合》

异构计算是指将不同类型的处理器（如CPU、GPU、FPGA等）组合在一个计算系统中，充分发挥各处理器的独特优势，以实现更高的计算性能和能效比。

#fpga开发 #HPC #深度学习

3776 

19 
Altair澳汰尔来自 2048 AI社区

2048ai.net · 2025-10-28 17:41:38

新闻速递丨Altair 全新发布 2026 Altair HPCWorks：实现 HPC、AI 与量子性能的跃升

Altair 近日宣布对 Altair®HPCWorks® 高性能计算 (HPC) 与云平台进行多项重大功能升级。Altair HPCWorks 2026 融合多项功能升级，为研发探索注入加速度。

#人工智能 #仿真 #HPC +2

932 

24 
weixin_42849849 来自 2048 AI社区

2048ai.net · 2025-09-06 10:54:34

Schwarz方法（Schwarz Method）学习资料网络资源

Schwarz方法（Schwarz Method）是求解偏微分方程（PDE）的一种经典区域分解方法（Domain Decomposition Method, DDM），由 Hermann A. Schwarz 在19世纪提出，用于证明 Dirichlet 问题解的存在性。现代计算数学中，它被广泛应用于并行计算、大规模科学计算和多物理场耦合问题中。如果你有具体方向（如用于有限元、并行计算、机器学习加

#HPC

907 

21 
weixin_42849849 来自 2048 AI社区

2048ai.net · 2025-09-06 09:57:05

HPDDM(High-Performance Domain Decomposition Methods)求解器库介绍和使用

✅高性能并行计算：支持 MPI + OpenMP 混合并行，适配大规模 HPC 系统。✅多种预条件子重叠型（如 Additive Schwarz, Restricted Additive Schwarz）非重叠型（如 BDDC, FETI-DP）多重网格（Multilevel）✅灵活的求解器接口：支持 Krylov 子空间方法（CG, GMRES, BiCGStab 等）。✅与外部库集成PETSc

#HPC

956 

11 
weixin_42849849 来自 2048 AI社区

2048ai.net · 2025-09-06 09:54:04

PETSc: HPDDM方法

HPDDM（High-performance PDDM）是基于 PDDM（Parallel Domain Decomposition Methods）发展而来的开源 C++ 库，由 Pierre Jolivet 等人开发。高效的并行域分解方法自适应粗空间构造（如 GenEO）与 PETSc、SLEPc 深度集成支持 MPI + OpenMP 混合并行支持复数、块矩阵、非对称问题在 PETSc 中，

#HPC

1149 

16 
weixin_42849849 来自 2048 AI社区

2048ai.net · 2025-09-04 15:34:45

OpenMP: 串行与并行混合的多段循环中，实现性能最大化建议

技巧说明✅ 复用parallel区域避免线程创建开销✅ 使用nowait消除不必要的同步✅ 合理schedule匹配负载特性✅reductionprivate避免数据竞争✅singlemaster控制串行段执行✅提高代码安全性通过以上方法，可以在串行与并行混合的多段循环中，实现OpenMP 性能最大化，同时保证正确性和可维护性。

#HPC

905 

13 
weixin_42849849 来自 2048 AI社区

2048ai.net · 2025-09-02 14:52:02

Constrained Pressure Residual (CPR) preconditioner

The Constrained Pressure Residual (CPR) preconditioner is a powerful and widely used technique in the numerical solution of systems of equations arising from the discretization of multiphase flow in p

#HPC

1592 

26 
HyperAI超神经来自 2048 AI社区

2048ai.net · 2025-08-25 16:57:46

从结合式异构加速到融合式 AI 加速，多位院士齐聚CCF HPC China共探科研新范式

在现代科学研究中，高性能计算（HPC）已成为推动重大突破的核心引擎，其以远超常规计算机的算力，为科学家提供了探索未知世界的「放大镜」和「加速器」。从模拟宇宙演化、预测气候变化，到揭示生命分子的运作机制、加速新药研发，HPC 正不断拓展人类认知的边界。尤其在数据爆炸与人工智能快速发展的时代，AI for Science 发展提速，在很多科研领域，尤其是在面对真实场景中的动态模拟、动态预测以及多尺度、

#HPC

607 

20 
weixin_42849849 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-05-01 12:28:07

数值求解Eikonal方程的方法及开源实现

Eikonal方程是一类非线性偏微分方程，形式为 ( |\nabla u(x)| = f(x) )，常见于波传播、几何光学、最短路径等问题。通过结合上述工具和方法，可高效求解Eikonal方程。实际应用中需根据问题规模、精度需求和计算环境选择合适方案。

#HPC

979 

10 
weixin_42849849 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-05-08 11:22:55

油藏模拟开源资源

在油藏模拟（Reservoir Simulation）领域，有许多开源工具和资源可供使用，涵盖从基础建模到高级数值模拟的各个环节。注意：开源工具通常需要一定的编程和油藏工程基础，部分工具文档可能不够完善，建议结合论文或社区（如GitHub Issues）学习。

#HPC

1386 

12 
Altair澳汰尔来自 2048 AI社区

2048ai.net · 2025-07-31 15:36:41

专家观点丨当AI遇上工程专家：谁才是智能时代的真正主角？

长期以来，关于 AI 的讨论始终被两种极端观点主导：要么是 AI 驱动未来的乌托邦幻想，要么是机器掌控世界的反乌托邦恐惧。此外，关于支撑 AI 训练所需计算能力的硬件创新也备受关注。

#仿真 #汽车 #HPC +1

741 

11 
猿代码科技来自 DAMO开发者矩阵

damodev.csdn.net · 2023-05-26 14:07:35

并行计算技术解密：MPI和OpenMP的学习和应用指南

本指南将带您深入了解MPI（Message Passing Interface）和OpenMP（Open Multi-Processing）两种重要的并行计算技术，并为您提供学习和应用的指南。无论您是从零开始学习并行计算，还是希望进一步提升您的技能水平，本指南将为您提供全面的学习和应用指南。本指南为您提供了MPI和OpenMP的全面学习和应用指南，帮助您进入并行计算的精彩世界。MPI和OpenMP

#人工智能 #HPC #AI

2355 
猿代码科技来自 DAMO开发者矩阵

damodev.csdn.net · 2023-06-30 10:25:38

超详细的高性能计算学习路线！错过后悔

高性能计算涉及许多方面的技术和概念，包括并行编程模型（如MPI、OpenMP和CUDA）、高性能文件系统（如Lustre和GPFS）、集群管理工具（如Slurm和PBS）以及性能分析和调优工具。虽然高性能计算已经取得了许多重要的成就和突破，但随着科学、工程和商业领域对计算能力需求的不断增加，高性能计算的发展依然具有巨大的潜力和前景。并行计算、分布式计算和优化算法是实现高性能计算的关键技术。硬件和技

#学习 #linux #人工智能 +1

2972 

5 
weixin_42849849 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-04-12 08:24:20

开源的PMPI库实现及示例代码

PMPI (Profiling MPI) 是MPI标准中定义的接口，允许开发者通过拦截MPI调用进行性能测量和调试。

#HPC

743 

4 
猿代码科技来自 DAMO开发者矩阵

damodev.csdn.net · 2023-04-26 14:33:43

AI+HPC?人工智能高性能计算方向就业新路子

但是AIGC浪潮之下，HPC高性能计算,这一计算科学上的明珠却实实在在出圈了。现如今人工智能方向算法岗逐渐见顶、如何找到一条有前景且有钱景、且不被GPT替代的路子，相信是很多开发同学关注的重点。今天就和大家介绍一个人工智能方向就业的新路子——AI+HPC。

#人工智能 #HPC #AI +1

1438 
weixin_42849849 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-04-27 18:32:49

分布式GPU上计算长向量模的方法

这种方法可以高效地计算分布在多个GPU上的大型向量的模，适用于大规模科学计算和机器学习应用。：向量被均匀分布在多个GPU上，每个GPU处理一部分数据。

#HPC

698 

5 
weixin_42849849 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-05-04 11:37:05

Reef3D 开源软件介绍

Reef3D 是一款开源的 CFD (计算流体动力学) 软件套件，专门用于模拟自由表面流动和波浪与结构的相互作用。它由挪威科技大学(NTNU)的海洋工程系开发，主要面向海洋工程、海岸工程和近海结构物设计等领域的研究和应用。

#开源软件 #HPC

623 

5 
猿代码科技来自 DAMO开发者矩阵

damodev.csdn.net · 2023-06-30 10:00:17

高性能计算详细的自学方法及路线，强烈建议收藏！

你想想，作为一个初学者，你每敲一个代码案例，就遇到这样那样的问题，出了问题还得花费很长的时间和精力去解决，搞来搞去，你还有多大的热情和动力继续学下去呢？欲哭无泪.......所谓”万事开头难“，其实很多东西一旦入了门，后面就很顺了，即使后期没有别人的帮助和指导，很多东西自己也大多都可以搞得定，但恰恰很多人的学习计划就死在了”入门“前的路上。细想一下，其实无论是要自学高性能计算，还是要自学开车，无论

#人工智能 #数据挖掘 #GPU +2

1119 
weixin_42849849 来自 DAMO开发者矩阵

damodev.csdn.net · 2025-04-12 21:07:55

HDF5文件中数据属性的读写操作示例

HDF5属性(attribute)是附加到数据集(dataset)或组(group)上的元数据，用于描述数据的特性。下面分别展示C++、Fortran和Python中如何读写HDF5属性。

#HPC

628 

1 
Altair澳汰尔来自 DeepSeek技术社区

deepseek.csdn.net · 2025-06-20 18:02:46

全球AI盛会丨亮点揭秘！3大会场，20+热点议题：AI 技术如何为工程设计、仿真与制造赋能

2025 年 6 月 26 日，Altair 将于线上举办面向广大工程师的全球线上会议 “AI for Engineers” 。会议将深度解析 AI 在产品开发、制造和高性能计算 (HPC) 领域的实际应用，包括：AI 赋能智能制造、AI驱动的智能工程、AI 助力不同学科的仿真、AI Agent、数字孪生与结果预测、知识图谱助力制造业创新等前沿议题。无论您是想加快仿真速度、简化生产流程，还是想更快

#AI #仿真 #HPC

868 

15 

标签介绍

HPC

——HPC

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net