logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

四旋翼无人机建模 (附github源代码)

https://github.com/ReinforcementLearning-StudyNote/ReinforcementLearning

文章图片
#无人机
强化学习Q-Learning算法

强化学习Q-Learning算法前言基本概念基本概念递推关系前言学习这个算法有一段时间了,但是因为自己犯懒一直没有整理。现整理一下,一方面有刚入门的同学可以参考,另一方面哪里写错或者理解不深的还请大家及时指正。基本概念基本概念首先列出一些强化学习中的基本概念,主要是为了帮助自己回忆起学习这个算法的过程。状态值函数:智能体在状态 sss 处的累计回报的期望值被称为智能在在采用策略 π\...

强化学习Q-Learning算法

强化学习Q-Learning算法前言基本概念基本概念递推关系前言学习这个算法有一段时间了,但是因为自己犯懒一直没有整理。现整理一下,一方面有刚入门的同学可以参考,另一方面哪里写错或者理解不深的还请大家及时指正。基本概念基本概念首先列出一些强化学习中的基本概念,主要是为了帮助自己回忆起学习这个算法的过程。状态值函数:智能体在状态 sss 处的累计回报的期望值被称为智能在在采用策略 π\...

四旋翼无人机建模 (附github源代码)

https://github.com/ReinforcementLearning-StudyNote/ReinforcementLearning

文章图片
#无人机
高斯过程回归中后验概率的简单推导

最近几天在整理高斯过程回归(Gaussian Process Regression, GPR)部分的知识,虽然还有很多问题没有搞懂,但是有一点进展还是决定总结下来,防止遗忘。在整理之前,先列出我参考的几个资料吧,一方面方便大家参考,另一方面也防止自己以后找不到了。哔哩哔哩视频:https://space.bilibili.com/97068901/video。里面有很多推导,其中一个就是G...

强化学习自然策略梯度Natural Policy Gradient推导

强化学习自然策略梯度Natural Policy Gradient推导学习笔记。

#算法#机器学习
四旋翼无人机建模 (附github源代码)

https://github.com/ReinforcementLearning-StudyNote/ReinforcementLearning

文章图片
#无人机
到底了