
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在计算任务运行过程中,除芯片故障外,往往需要关注芯片的网络和算力使用情况,以便确认任务运行过程中的性能瓶颈,找到提升任务性能的方向。MindCluster提供了部署在计算节点的NPU Exporter组件,用于上报从驱动中获取到的芯片、网络的各项数据信息。
在计算任务运行过程中,除芯片故障外,往往需要关注芯片的网络和算力使用情况,以便确认任务运行过程中的性能瓶颈,找到提升任务性能的方向。MindCluster提供了部署在计算节点的NPU Exporter组件,用于上报从驱动中获取到的芯片、网络的各项数据信息。
创建容器时,为了容器内部能够正常使用昇腾AI处理器,需要引入昇腾驱动相关的脚本和命令。这些脚本和命令分布在不同的文件中,且存在变更的可能性。为了避免容器创建时冗长的文件挂载,MindCluster提供了部署在计算节点上的Ascend Docker Runtime组件。通过输入需要挂载的昇腾AI处理器编号,即可完成昇腾AI处理器及相关驱动的文件挂载。
创建容器时,为了容器内部能够正常使用昇腾AI处理器,需要引入昇腾驱动相关的脚本和命令。这些脚本和命令分布在不同的文件中,且存在变更的可能性。为了避免容器创建时冗长的文件挂载,MindCluster提供了部署在计算节点上的Ascend Docker Runtime组件。通过输入需要挂载的昇腾AI处理器编号,即可完成昇腾AI处理器及相关驱动的文件挂载。
创建容器时,为了容器内部能够正常使用昇腾AI处理器,需要引入昇腾驱动相关的脚本和命令。这些脚本和命令分布在不同的文件中,且存在变更的可能性。为了避免容器创建时冗长的文件挂载,MindCluster提供了部署在计算节点上的Ascend Docker Runtime组件。通过输入需要挂载的昇腾AI处理器编号,即可完成昇腾AI处理器及相关驱动的文件挂载。
K8s对资源信息的调度依赖感知的资源信息。除基础的CPU和内存信息以外,需通过K8s提供的设备插件机制,供用户自定义新的资源类型,从而定制个性化的资源发现和上报策略。MindCluster提供了部署在计算节点的Ascend Device Plugin服务,用于提供适合昇腾设备的资源发现和上报策略。
K8s对资源信息的调度依赖感知的资源信息。除基础的CPU和内存信息以外,需通过K8s提供的设备插件机制,供用户自定义新的资源类型,从而定制个性化的资源发现和上报策略。MindCluster提供了部署在计算节点的Ascend Device Plugin服务,用于提供适合昇腾设备的资源发现和上报策略。







