logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习基础原理详解与核心公式

强化学习融合了控制论、博弈论、运筹学与机器学习等多个领域的思想,是构建智能体的一种重要方式。理解其基础原理和核心公式,是学习深度强化学习、AlphaGo、自动驾驶等高阶应用的关键第一步。深度强化学习(DQN、DDPG、PPO、A3C)策略梯度的推导与实现强化学习的代码实战(基于Python和PyTorch)

#人工智能
强化学习系列——深度Q网络(DQN算法)

深度Q网络(Deep Q-Network,DQN)是一种强化学习算法,通过结合深度神经网络和Q-learning算法,用于解决具有高维状态空间的强化学习问题。DQN是由DeepMind提出的,并在解决Atari游戏中取得了显著的成功。在传统的Q-learning算法中,我们使用一个Q表来存储每个状态动作对的动作值函数。然而,当状态空间非常大时,使用Q表变得非常困难,甚至不可行。DQN通过使用一个深

文章图片
#算法#人工智能
SciPy 库中maximum_filter配合generate_binary_structure获取局部极大值

是 SciPy 库中的一个函数,它用于计算图像的最大值滤波。这个函数在图像处理中经常被用到,特别是在特征提取和边缘检测等任务中。input: 输入的 ndarray。将应用滤波器的输入图像或数据。size: 标量或元组,可选。定义滤波器窗口的大小。如果是一个标量,那么这将是每个维度的大小。如果是一个元组,那么这将指定每个维度的大小。footprint: 布尔数组,可选。定义滤波器的形状,如果提供了

文章图片
#scipy#计算机视觉#人工智能
多头注意力机制

多头自注意力机制是自注意力机制(Self-Attention)的一种扩展形式,它通过将输入数据分为多个头(Head),并对每个头进行自注意力计算,最后将多个头的结果拼接起来,得到最终的输出。使用多头自注意力可以使得模型在处理长序列数据时更加有效。

文章图片
#pytorch#深度学习#人工智能
指数移动平均EMA

指数移动平均(Exponential Moving Average,简称EMA)是一种常用的平滑方法,通常用于时间序列数据的平滑处理。EMA 可以减小噪声的影响,使得数据更加平滑,并且能够自适应地调整权重,更好地反映时间序列的趋势。EMAtx0t0αxt1−αEMAt−1t0EMAt​x0​αxt​1−αEMAt−1​​t0t0​其中,xtx_txt​表示时间ttt的观测值,EMAt。

文章图片
#机器学习#算法#numpy
ROI Align原理介绍

是PyTorch的一个操作函数,用于在给定的RoIs(感兴趣区域)上执行空间变换网络。该操作函数可以被用于目标检测和物体识别等计算机视觉任务中,通常在RoI池化之前被执行。RoI Align(Region of Interest Align)是RoI池化的一种改进,它可以更加精确地对齐RoI中的特征,避免了RoI池化过程中的信息损失。具体来说,RoI Align操作首先将RoI区域划分为若干个小的

文章图片
#算法
目标检测中AP50 AP75 APs APm APl 含义

在目标检测领域,我们经常会遇到一些评价指标,这些指标有助于衡量模型的性能。:平均精度,用于衡量目标检测模型的准确性。它考虑了不同置信度阈值下的精度,并计算出一个平均值。通常,我们使用不同的阈值(例如0.5、0.75等)来计算AP。:平均召回率,表示平均召回率。与AP类似,它也考虑了不同阈值下的召回率,并计算出平均值。AP50:在IoU(交并比)大于50%时的平均精度。AP75:在IoU大于75%时

文章图片
#目标检测#目标跟踪#人工智能
Ubuntu安装Node.js v18.16.0

打开终端并更新包管理器:安装 Node.js v18.16.0:确认 Node.js 是否已成功安装:node -v如果 Node.js 安装成功,将会输出版本号v18.16.0。

文章图片
#ubuntu#node.js#linux
nn.InstanceNorm2d和nn.BatchNorm2d比较

和都是 PyTorch 中常用的归一化层,用于提高神经网络的训练稳定性和泛化能力。

文章图片
#pytorch
    共 13 条
  • 1
  • 2
  • 请选择