logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【机器学习】卷积神经网络(CNN)

卷积神经网络(CNN)是一种深度学习模型,通过多层结构实现图像识别等任务。CNN包括输入层、卷积层、池化层、全连接层和输出层。输入层接收原始数据,卷积层通过滑动卷积核提取图像特征,池化层进一步压缩特征图,减少过拟合并提高模型对平移等变换的鲁棒性。全连接层将提取的特征展开并进行分类或回归任务,输出层通过Softmax函数生成概率分布,完成最终预测。CNN广泛用于图像处理、手写数字识别等领域,具有很强

文章图片
#机器学习#cnn#人工智能
【机器学习】层归一化(Layer Normalization)

Layer Normalization 是一种神经网络归一化方法,通过对每层神经元的激活值进行归一化,解决梯度消失和梯度爆炸问题。不同于批量归一化,LayerNorm 针对每个样本的每层神经元操作,适用于深层网络和小批量训练。它通过计算均值和标准差将激活值归一化,并使用可学习的参数进行缩放与偏移。通过对比带有 sigmoid 激活函数的深层网络,展示了 LayerNorm 如何在前向传播时保持激活

文章图片
#机器学习#人工智能
到底了