logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【强化学习】深入理解:PPO(Proximal Policy Optimization) 和 TRPO(Trust Region Policy Optimization) 的本质区别

本文对比分析了强化学习中的PPO(Proximal Policy Optimization)和TRPO(Trust Region Policy Optimization)算法。PPO通过裁剪目标函数间接控制策略更新幅度,计算高效且实现简单;而TRPO采用KL散度约束和自然梯度方法,计算复杂但稳定性更高。文章从优化目标、计算复杂度、收敛性、实现难度等方面详细比较了两者的差异,指出PPO更适合大规模应

文章图片
#算法#人工智能#机器学习 +1
图神经网络(GNN)

图不但包含数据,也包含数据之间的依赖关系,因而图神经网络(GNN)在自然语言处理(NLP)方面的表现有着非常大的潜力。图神经网络(GNN)最擅长处理和建模图结构数据。GNN的工作原理简单概况就是,聚合节点的邻居节点/边的信息,来更新节点的向量表征。​

文章图片
#人工智能#神经网络#深度学习
基于stm32f103的DDS芯片AD9959调试(简单了解一下)

前言:AD9959 是美国ADI公司最新推出的一款四通道高速直接 数字频率合成器 。该芯片内部集成了四个 DDS 核,因此可对四个内部同步输出通道独立进行编程。通过一个公用系统时钟在芯片内部同步其独立的通道,AD9959可以对由于模拟处理(例如滤波、放大)或者PCB布线失配而产生的外部信号通道的不均衡进行有效的校正,实现最多16电平的频率、相位和幅度调制,还可以工作在线性调频、调相或调幅模式。..

文章图片
#stm32#c语言#c++ +1
【启发式算法】RRT*算法详细介绍(Python)

RRT*算法(Rapidly-exploring Random Tree Star)是一种用于机器人路径规划的算法,旨在为机器人找到从起点到目标的最短路径,同时避免障碍物。它是基于RRT(Rapidly-exploring Random Tree)算法的改进版,具有更高的路径质量和优化能力。RRT*的关键特点是它能够在搜索过程中逐渐优化路径,最终找到一条接近最短的路径。

文章图片
#人工智能#python#机器学习 +1
2022年上半年第十三届蓝桥杯嵌入式组题解

2022年上半年第十三届蓝桥杯大赛嵌入式组已经结束一段时间了,最近想着将题目和自己解答重新总结一下。我采用的开发板时旧的版本STM32f103系列的开发板CT117E(建议用新的开发板学习,因为会逐渐淘汰旧的开发板),使用的库是标准库,编程软件是keil5 MDK版。...

文章图片
#蓝桥杯#stm32#c语言 +2
当深度强化学习(DRL)遇见图神经网络(GNN)

将图神经网络(GNN)与深度强化学习(DRL)相结合。新的DRL+GNN体系结构能够在任意网络拓扑图上学习、操作和生成。图神经网络(Graph Neural Networks,GNN)是一种新型的神经网络,用于对图结构信息进行操作。它们的基本形式是将一些初始状态与图中的不同元素相关联,然后结合这些元素在图中的相互关系。迭代算法更新状态元素并使用最终状态产生输出.

文章图片
#神经网络#人工智能#深度学习
Transformer在小目标检测上的应用

小目标检测(Small Object Detection, SOD)作为通用目标检测的一个子领域,专注于对小尺寸目标的检测,在监控、无人机场景分析、行人检测、自动驾驶中的交通标志检测等各种场景中都具有重要的理论和现实意义。Transformer模型首次作为一种新颖的机器翻译技术被引入。该模型旨在超越传统的循环网络和CNN,通过引入一种完全基于注意力机制的新网络架构,从而消除了对循环和卷积的需求。目

文章图片
#目标检测#人工智能#计算机视觉 +1
模型驱动的深度学习方法

模型驱动的深度学习方法显然保留了一些模型驱动方法的优势(其确定性与驱动性)同时也避免了必须精确建模的缺点。它同时也兼备了深度学习方法强大的学习能力,而又克服了网络拓扑结构选择的困难。这使得深度学习方法的可设计性和可预测性变成可能,并且在实际应用中很好地平衡了通用性和相关性之间的关系。指出模型驱动的方法和数据驱动的方法二者之间并非相对的关系。

文章图片
#深度学习#人工智能
深度学习方法的改进

深度学习的成功来自于以下 3 个要素:一是数据:二是算法:三是算力:早在 2014 年,深度学习的诸多缺陷不断地被发现,预示着这条道路遇到了瓶颈。深度学习为何如此脆弱,容易受攻击,被欺骗和不安全。基于深度学习的 AI 具有不可解释性和鲁棒性差等缺陷,并针对这两个缺陷展开分析。2 深度学习的改进分析2.1可解释性问题人类理解机器决策过程的核心难点是跨越数据特征空间和人类语义空间之间的鸿沟。

文章图片
#深度学习#人工智能
Transformer在小目标检测上的应用

小目标检测(Small Object Detection, SOD)作为通用目标检测的一个子领域,专注于对小尺寸目标的检测,在监控、无人机场景分析、行人检测、自动驾驶中的交通标志检测等各种场景中都具有重要的理论和现实意义。Transformer模型首次作为一种新颖的机器翻译技术被引入。该模型旨在超越传统的循环网络和CNN,通过引入一种完全基于注意力机制的新网络架构,从而消除了对循环和卷积的需求。目

文章图片
#目标检测#人工智能#计算机视觉 +1
    共 82 条
  • 1
  • 2
  • 3
  • 9
  • 请选择