草帽B-O-Y 个人主页

@u013236946

草帽B-O-Y

2022-07-29 15:20:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

深度强化学习——连续动作控制DDPG、NAF

传统的DQN只适用于离散动作控制，而DDPG和NAF是深度强化学习在连续动作控制上的拓展。

#深度学习

深度强化学习——A3C

异步的优势行动者评论家算法（Asynchronous Advantage Actor-Critic，A3C）是Mnih等人根据异步强化学习（Asynchronous Reinforcement Learning， ARL）的思想，提出的一种轻量级的 DRL 框架，该框架可以使用异步的梯度下降法来优化网络控制器的参数，并可以结合多种RL算法。

#深度学习

小脑神经网络——CMAC

小脑神经网络小脑神经网络（CMAC-Cerebellar Model Articulation Controller）是由Albus最初与1975年基于神经生理学提出的，它是一种基于局部逼近、简单快速的神经网络，能够学习任意多维非线性拟合。相比于BP网络等全局逼近方法，CMAC具有以下优点

#神经网络

IMU姿态融合（MPU9250从校正到滤波步骤）

MPU9250包括三轴加速度计、三轴陀螺仪和三轴磁力计。因为加速度/磁力计具有高频噪声（需要低通滤波），将加速度/磁力计的信号看成是音频信号，它们的信号会有很多“毛刺“，也就是说它们的瞬时值不够精确，解算出来的姿态会震荡，但长期来看姿态方向是对的。而陀螺仪具有低频噪声（需要高通滤波），即每个时刻的得到的角速度是比较精确的，使用积分就能得到旋转角度

深度强化学习——DQN

DQN（Deep Q-Learning）可谓是深度强化学习（Deep Reinforcement Learning）的开山之作，是将深度学习与增强学习结合起来从而实现从感知（Perception）到动作（ Action ）的端对端（End-to-end）学习的一种全新的算法。

#深度学习

深度强化学习——Dueling-DDQN

深度双Q网络（DDQN）和基于竞争构架Q网络（Dueling-DQN）都是DQN的改进版本，前者是对DQN训练算法的改进，后者是对DQN模型结构的改进。

#深度学习

和声搜索算法——个人解读

和声搜索算法(Harmony search， HS)是一种新兴的智能优化算法，通过反复调整记忆库中的解变量，使函数值随着迭代次数的增加不断收敛，从而来完成优化。算法概念简单、可调参数少、容易实现。类似于模拟退火算法对物理退火的模拟、遗传算法对生物进化的模仿、以及粒子群优化算法对鸟群的模仿等，和声算法模拟了音乐演奏的原理，它是 2001 年韩国学者 Geem Z W 等人提出的一种新颖的智能优化算法

到底了