logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

R-CNN 模型算法流程梳理

R-CNN是2014年提出的经典目标检测方法,采用多阶段处理流程:1)使用Selective Search生成约2000个候选框;2)将每个候选框缩放后输入CNN(如AlexNet)提取特征;3)用SVM分类器判断类别;4)通过回归器调整边界框位置。该方法存在三个主要局限:CNN特征提取与后续步骤分离(非端到端)、候选框变形影响精度、处理速度极慢(每个框独立计算)。这些缺点促使了Fast R-CN

文章图片
#cnn#算法#目标跟踪 +3
Batch Normalization 的原理

BatchNormalization(BN)是一种用于加速深度神经网络训练的技术,通过标准化每一层的输入使其具有零均值和单位方差。其核心步骤包括:计算小批量的均值和方差,进行标准化,并引入可学习的缩放和平移参数以保持模型表达能力。BN能缓解内部协变量偏移,稳定训练过程,允许使用更高学习率,并起到一定正则化作用。训练时使用当前批次的统计量,推理时则采用滑动平均值。BN有效解决了梯度不稳定等问题,提高

文章图片
#batch#人工智能#深度学习
U-Net--学习记录

U-Net是一种用于语义分割的卷积神经网络,采用U形结构,包含编码器、解码器和跳跃连接。它支持二分类和多分类交叉熵损失计算,并采用加权像素级损失解决类不平衡问题。论文中U-Net输入572x572图像,输出388x388,通过弹性形变等数据增强训练。现代实现多采用same padding保持输入输出尺寸一致。U-Net及其变体(如U-Net++、3D U-Net)广泛应用于医学图像、卫星图像等领域

文章图片
#学习
深度学习CNN基础网络架构

卷积神经网络(CNN)的基础网络架构包括多个经典模型,每个模型都有其独特的特点和应用场景。LeNet-5是最早的卷积网络,适用于轻量设备,但已不常用于目标检测。AlexNet是深度CNN的启蒙,虽然已淘汰,但引入了ReLU激活函数和Dropout正则化等技术。VGG网络结构简单,参数多,常用于目标检测,但不适合轻量设备。GoogLeNet/Inception通过多分支结构实现高效计算,适合目标检测

文章图片
#学习#深度学习#神经网络 +3
K-means聚类算法--原理及代码

K-means是一种经典的无监督聚类算法,通过迭代优化将数据划分为K个簇,使簇内样本相似度高。算法流程包括初始化中心点、样本分配、中心点更新等步骤,目标是最小化簇内平方误差。其优点是简单高效,但对初始中心敏感且需预设K值。文章通过Python代码演示了K-means在模拟数据上的应用,包括数据处理、聚类实现和结果可视化,并分析了算法的优缺点。

文章图片
#kmeans#聚类#算法
深度学习CNN基础网络架构

卷积神经网络(CNN)的基础网络架构包括多个经典模型,每个模型都有其独特的特点和应用场景。LeNet-5是最早的卷积网络,适用于轻量设备,但已不常用于目标检测。AlexNet是深度CNN的启蒙,虽然已淘汰,但引入了ReLU激活函数和Dropout正则化等技术。VGG网络结构简单,参数多,常用于目标检测,但不适合轻量设备。GoogLeNet/Inception通过多分支结构实现高效计算,适合目标检测

文章图片
#学习#深度学习#神经网络 +3
深度学习常见的激活函数及图像

本文总结了当前常见的激活函数,并将其分类为经典基础函数、改进型函数和新一代函数。经典基础函数包括ReLU、Sigmoid、Tanh和Softmax,这些函数在神经网络中广泛应用。改进型函数如LeakyReLU、PReLU和ELU,通过引入参数或调整负值处理方式,解决了经典函数的一些问题。新一代函数如SiLU、Swish、GELU和Mish,具有更平滑的梯度和更强的非线性表达能力,适用于深层网络和复

文章图片
#深度学习#人工智能#神经网络
深度学习常见的激活函数及图像

本文总结了当前常见的激活函数,并将其分类为经典基础函数、改进型函数和新一代函数。经典基础函数包括ReLU、Sigmoid、Tanh和Softmax,这些函数在神经网络中广泛应用。改进型函数如LeakyReLU、PReLU和ELU,通过引入参数或调整负值处理方式,解决了经典函数的一些问题。新一代函数如SiLU、Swish、GELU和Mish,具有更平滑的梯度和更强的非线性表达能力,适用于深层网络和复

文章图片
#深度学习#人工智能#神经网络
到底了