logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何使用npu加速模型训练

现有一台Atlas800(3010)的服务器,使用2.5.0版本的mindspore,但在代码中设置设备时无法选择ascend,请问我如何才能使用npu资源。

#排序算法#机器学习#深度学习
MindSpore bert模型训练aicore利用率为0

说明:代码基本都是自己实现,没有参照码云仓bert模型实现,只有在前向梯度累加部分完全复用MindSpore官网代码,链接:https://www.mindspore.cn/tutorial/training/zh-CN/r1.2/advanced_use/apply_gradient_accumulation.html。主要原因还是代码的问题,由于前向使用的是官网提供的梯度累加的代码,直接改为封

#bert#深度学习#人工智能
利用mindspore下面mindzoo里面的yolov3-darknet53进行目标识别,模型训练不收敛

Modelzoo中yolov3-darknet53代码(mindspore1.1源码中的modelzoo)。运行环境:mindspore-gpu1.4.1docker,python3.7.5【操作步骤&问题现象】1、数据方面:原始数据是公开比赛数据xinye,标注标准是coco2014格式。数据的组织形式是按照yolov3-darknet53. 其中训练数据1300张,大小为960*720(wid

#python#深度学习
【MindSpore】【lstm】在昇腾芯片上图算融合出错

2.不需要加任何flag控制,直接拉取r1.5分支的包,运行网络脚本,这个问题应该也不会出现。(推荐使用该解决方案,因为r1.5版本,图算的功能应该更加完善,鲁棒性更强。1.继续使用r1.3分支的包来使能图算融合,需要在设置的时候多加一个限制,将代码从。...

#servlet#tomcat#java
分布式训练时出现警告

训练环境:ModelArtsAscend: 2*Ascend 910|ARM: 48核 192GB镜像:mindstudio6.0.rc2-ascend910-cann6.3.rc2-euler2.8.3-aarch64。

文章图片
#人工智能#python
【Mindspore产品】【通过SummaryRecord记录日志功能】ModelArts上训练没有生成日志文件

问题描述:通过SummaryRecord模块生成summary日志文件【操作步骤&问题现象】1、环境:使用计算中心的ModelArts,在昇腾上对mindspore模型进行训练;2、代码:参考文档(https://www.mindspore.cn/mindinsight/docs/zh-CN/r1.6/summary_record.html?highlight=summary)中第三种方式记录数据

#深度学习#神经网络
[基于MindSpore深度学习框架实现图片分类应用]在线实验记录

张小白正在发奖品晒单贴,突然发现自己的贴子瞬间被淹没在浩瀚的在线实验贴的海洋中。原来MindSpore大大又搞新活动了。。。[活动公告] 双11优惠让你崩溃?别算了,MindSpore在线体验+发礼品全部都是免费!https://bbs.huaweicloud.com/forum/thread-85654-1-1.html虽然具体的内容也不是特别懂,就一边进去跑跑,一边get些知识点吧。。MINS

#python#算法
【mindspore】训练模型第二轮的时候出错,出现警告:很多w参数没有用进模型里面,训练loss为NAN

***************************************************解答*****************************************************报的Warning 意思是模型中的权重再当前ad过程中似乎没有用到报出来的,可能是GAN网络的生成模型和判别模型中的参数有些可能确实再模块中没有用到,和这个 Nan没关系,建议调整一下模型

#python#深度学习
mindspore昇腾版本支持在非昇腾设备上对模型进行编译吗

这里如果CANN环境变量配置不正确,会给出具体的原因,但是按照说明配置好环境变量以后,不再有具体的原因了,依然是load失败,所以是不是mindspore或CANN不支持在非昇腾设备上进行图编译?我分别尝试了源码编译minspore2.0和pip安装mindspore2.1,分别按照安装说明中指定的版本安装了对应的Ascend-cann-toolkit_具体安装指导参考:https://minds

文章图片
#神经网络#深度学习
mindspore昇腾改用GPU训练出现loss为inf和nan

昇腾版改GPU训练出现loss为inf和nan.只改了device_target=GPU。这两个警告是什么原因呀?[mindspore/ccsrc/backend/kernel_compiler/gpu/gpu_kernel_factory.cc:94] ReducePrecision] Kernel [StandardNormal] does not support int64, cast in

#深度学习#神经网络
    共 132 条
  • 1
  • 2
  • 3
  • 14
  • 请选择