flow blue 个人主页

@weixin_43885443

flow blue

2026-02-28 14:47:48 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

TrafficFormer模型在昇腾平台上迁移适配实践

网络流量分析是网络安全与运维的关键技术，但传统方法依赖大量人工标注数据，泛化能力差。自监督预训练模型的出现为解决标注数据稀缺问题提供了新思路。本文基于昇腾 AI 平台，介绍 TrafficFormer 的模型架构、环境部署与预训练实践。

#pytorch #人工智能

TrafficFormer模型在昇腾平台上迁移适配实践

#pytorch #人工智能

Lagrangian_MGN粒子流体仿真模型在NPU上的迁移部署指南

Lagrangian_MGN 是 NVIDIA PhysicsNeMo 中基于图神经网络的拉格朗日粒子流体仿真模型，适用于无网格粒子型流体、固体及可变形材料的模拟。该模型将粒子视为图节点，相互作用视为边，通过自回归方式预测粒子加速度与轨迹，相比传统 CFD 方法可提速 100–1000 倍。本文以开发者视角，详细记录在昇腾 NPU 环境下完成模型环境搭建、数据准备、训练迁移及性能验证的全过程，为同

#pytorch

Lagrangian_MGN粒子流体仿真模型在NPU上的迁移部署指南

#pytorch

昇腾多机训练中HCCL通信问题的分析与解决

在大规模深度学习训练任务中，多机多卡分布式训练已成为提升训练效率的主流方式。在实际使用PyTorch框架结合昇腾CANN进行8机训练任务时，我们遇到了任务拉起失败的问题。本文记录了该问题的详细排查过程与解决方案，旨在为遇到类似问题的开发者提供参考。本文分析了基于PyTorch和CANN进行多机分布式训练时出现的HCCL建链超时问题，并提供了通过指定通信网卡和调整超时配置的有效解决方案。在类似的大规

#pytorch

昇腾多机训练中HCCL通信问题的分析与解决

#pytorch

昇腾多机训练中HCCL通信问题的分析与解决

#pytorch

昇腾多机训练中HCCL通信问题的分析与解决

#pytorch

FlexRibbon模型性能优化实践

随着深度学习模型复杂度的不断提升，如何在异构计算平台上实现接近主流GPU的推理性能成为开发者面临的重要挑战。本文以FlexRibbon模型在Atlas 800I A3硬件平台上的性能优化为例，系统介绍了模型完整优化方案。通过组合应用流水线并行、算子优化、内存布局调整等多种技术手段，显著提升了模型在昇腾平台上的执行效率，为同类模型的性能优化提供了可复用的实践经验。本文详细介绍了FlexRibbon模

#性能优化

FlexRibbon模型性能优化实践

#性能优化

共 15 条

请选择