m0_56294205 个人主页

@m0_56294205

m0_56294205

2023-09-27 10:03:48 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

MNIST简单线性模型训练过程的原理

理解一下这个loss到底是什么，根据查阅相关资料和程序分析，这个loss应该是这个批次，即这64个十维向量输出的所有概率损失求平均或者求和得到的，根据球的的这个损失使用后续的优化算法找到使其梯度下降的最快的方向，这里这个梯度的求取是矩阵梯度的运算，这个在高等数学和线性代数中并没有深入了解过，但可以类比一下微积分里梯度的概念，只不过微积分是连续的函数，矩阵是离散的数据，这样的数据也是可以求取梯度的。

#人工智能 #深度学习 #机器学习

MobileNetV3代码（pytorch）

提取用于DW卷积的池化后一维向量，两个fc全连接层，第一个全连接把和特征图通道数一样长度的一维向量缩短为1/4，之后第二个全连接把通道数还原回原来的长度，经过训练的一维向量每个位置的值就是经过DW卷积后的特征矩阵的每一层的权重，把这个每一层的权重和每个通道上的数值相乘。1、MobileNetV1的深度可分离卷积DW（depthwise separable convolutions）。减少第一层卷积

#pytorch #人工智能 #python

FCN(pytorch)

【代码】FCN(pytorch)

#pytorch #人工智能 #python

EfficientNetV1(pytorch)

读模型代码我喜欢从最下面的 def efficientnet_b2(num_classes=1000):模型定义时候开始看，从传参调用一个一个去看模型的整个结构，包括所有MBConv模块参数的构建，所有层的构建，小模块的构建等等细节。这个和MobileNetV3有些不同，第一层全连接长度不是升维后的3*3DW卷积维度的1/4，二是PW升维前的输入通道的1/4。之前的研究探索的是单个因改变的影响，这

#pytorch #人工智能 #python

深度学习的GPU版环境配置遇到的问题以及一部分的解决方法

比如先更新NVIDIA显卡驱动，创建虚拟环境，安装一个cuda版本的putorch的国内安装方法，先装轮子文件，再使用pip再Anoconda Prompt控制台下使用特定语句安装，新版pycharm配置anoconda的python环境在环境目录下找不到解释器的问题，等等。查看已经安装的包，进入相关环境，conda list,可以查看到pytorch三个包版本以及是不是cuda版，以及哪个cud

#深度学习 #人工智能

关于数据集的总结

COCO数据集旨在提供一个丰富的、多样化的场景，包括各种常见和复杂的对象，以推动计算机视觉算法的研究和发展。因此，无论是提到MS COCO还是COCO数据集，它们指的都是同一个广泛使用的大规模计算机视觉数据集，用于目标检测、图像分割、关键点检测和图像描述等任务。它具有丰富多样的场景、多样性的目标类别和详细的标注信息，成为计算机视觉算法研究和评估的重要基准数据集。通过在LVIS数据集上进行研究，可以

#深度学习 #人工智能 #机器学习

到底了