小乐快乐个人主页

@weixin_45666880

小乐快乐

2022-10-25 16:51:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

MindSpore并行训练中梯度同步异常Loss shows abnormal fluctuation: from 0.25 to 1.56 within 10 steps

在使用华为昇腾MindSpore进行分布式训练时，我遇到了梯度同步异常的问题。具体表现为在Ascend 910硬件平台上使用并行训练模式时，模型参数更新不一致，导致训练精度大幅下降。该问题在单卡训练时不会出现，仅在多卡并行环境下发生。

#人工智能 #深度学习 #算法 +1

MindSpore并行训练中梯度同步异常Loss shows abnormal fluctuation: from 0.25 to 1.56 within 10 steps

#人工智能 #深度学习 #算法 +1

利用mindspore中resnet50对猫狗分类数据集时出现问题

mindspore.dataset1、先读取猫狗分类数据集2、利用resnet50进行分类时，遇到error【截图信息】解答：你可以把 label 和 image 都转换成 numpy 再试下。

#python

昇腾310运行YOLOv5模型时GRAPH接口调用异常与模型精度下降

使用华为昇腾310进行YOLOv5模型推理过程中，我遇到了两个关键技术问题。首先，在尝试使用GRAPH相关接口（如rungraph、addgraph）时出现兼容性问题。其次，经过模型转换后，虽然模型大小显著减小，但推理精度明显下降，且推理时间几乎没有改善。

#深度学习 #开发语言 #算法

昇腾310运行YOLOv5模型时GRAPH接口调用异常与模型精度下降

#深度学习 #开发语言 #算法

mindspore自定义数据集遇到了问题

最近在学习和使用mindspore框架，使用的是自己构建的数据集，做的是二分类的分割任务，训练数据是一张张图片，数据标签也是一张张图片，官网提供的教程都十分的简单，我在码云上也没有找到关于自定义数据集的例子，都使用的是mindspore内置的经典数据集，想问一下哪里有参考的样例或者教程吗下面是我自己写的构建数据集的部分：不知道这样写有没有问题，目前创建的训练作业，但是一直都在排队，结果还没出来解答

#人工智能 #数据挖掘 #分布式 +1

mindspore将自定义数据集转换为MindRecord格式

问题描述：电脑是win10 64bit，cpu运行，MindSpore版本1.5.0，python版本3.9。运行的是文档中数据集加载中，数据集转换的代码：最后一步writer.commit()出错，错误代码：解答：1. windows平台上，目前还不支持 MINDRECORD_FILE = "test.mindrecord" 放在中文路径下。即：这个路径中不能有中文。...

#大数据

MindSpore:npu 多卡训练自定义数据集如何给不同npu传递不同数据

使用GeneratorDataset的时候，可以使用num_shards=num_shards,shard_id=device_id参数来控制不同卡读取哪个分片的数据，__getitem__和__len__按全量数据集处理即可。是在ds.GeneratorDataset传递num_shards=num_shards,shard_id=device_id还是自定义数据集__getitem__里面用r

#深度学习 #人工智能 #服务器

深度学习单机多卡GPU 用mpirun跑分布式训练，2卡不报错正常运行，但是4卡GPU或8卡GPU报错无法解决

***************************************************解答*****************************************************从你的截图里只知道你在第三张卡（rank2）上的程序被killed了，signal 9 是linux scheduler杀死进程而非进程自己退出（用2GPU可以跑，但是4GPU或8GPU会

#深度学习 #人工智能

导入numpy、训练模型时，UserWarning: The value of the smallest subnormal for ＜class ‘numpy.float64’＞ type is z

云上开发环境，无需配置环境，即可灵活调试运行代码。注意一个用户只能启动一个jupyter实例，且16个小时后会自动释放资源，到期时间前请及时将资源下载到本地单次运行时长为16小时，关闭后会释放资源规格 1*ascend-snt9b|ARM: 19核 180GB镜像 python3.9-ms2.7.0-cann8.2.RC1特性预装mindspore、numpy、pandas等依赖我自己的香橙派上

#numpy #深度学习 #人工智能 +1

共 196 条

请选择