登录社区云,与社区用户共同成长
邀请您加入社区
cluster_analyse:集群场景下,如千卡、万卡等无法直接分析全部数据的场景,可通过此工具来提取集群迭代耗时和通信数据, 快速定位慢卡、慢节点以及慢链路问题。支持比较GPU与NPU之间、NPU与NPU之间的单卡性能差异,更推荐在GPU迁移NPU性能劣化、性能抖动等有基线比对数据的场景使用。AI框架Profiler接口封装了msprof命令行工具,进一步增加了对AI框架层性能数据的采集与解析
更新时间:2025/09/17随着人工智能模型规模的不断扩大及应用场景的日益复杂,在昇腾AI计算平台上进行训练和部署时,面临着Host-Device协同效率不高、重要算子性能下滑、通信延迟增大、模型下发效率低等诸多挑战。因此,深度学习系统的性能瓶颈也从计算能力提升,转变为对硬件平台、软件栈、通信机制以及模型结构之间的协同效率进行全面优化的需求。在此背景下,迫切需要构建一套系统性的性能分析与优化框架
AI变革正酣,之江潮水奔流。当宇树Unitree机器人火热出圈、DeepSeek/Qwen等大模型获得全球广泛关注、群核科技的空间智能影响多个行业……浙江,这片“敢为天下先”的土地,在人工智能产业又一次勇立潮头。数据显示,2024年浙江省人工智能核心产业营业收入接近5800亿元,增长势头强劲。浙江最新《关于支持人工智能创新发展的若干措施》(以下简称《若干措施》)更提出,到2027年,初步形成可持续
开发板使用的昇腾 SOC 总共有 4 个 CPU,这 4 个 CPU 既可以设置为 controlCPU,也可以设置为 AI CPU。如果当前环境模型中无 AI CPU 算子,且运行业务时查询 AI CPU 占用率持续为 0,则可以将 AI CPU 的数量配置为 0。当 Linux 系统跑满后,使用 htop 命令会看到有一个 CPU 的占用率始终接近 0,请注意,这是正常的。如果不需要使用 AI
flyfish
昇腾
——昇腾
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net