强化学习算法介绍

强化学习算法介绍对比学习一：sarsaQ-learningDQNpolicy gradientDDPGActor-CriticSoft Actor-CriticA3CPPO离散：DQN连续：DDPG

Cater Chen

281人浏览 · 2021-06-02 17:42:20

Cater Chen · 2021-06-02 17:42:20 发布

强化学习算法介绍

在这里插入图片描述

对比学习一：
- sarsa
- Q-learning
DQN
policy gradient
DDPG
Actor-Critic
Soft Actor-Critic
A3C
PPO
离散：DQN
连续：DDPG

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

cover

DeepSeek 大爆发，带来了哪些新希望？

腾讯云开发者社区

cover

李建忠：智能体正将互联网从信息网络重构为行动网络

腾讯云开发者社区

cover

探秘 DeepSeek 落地进展，腾讯云携手业界专家共话 AI 生产力

腾讯云开发者社区

所有评论(0)

Cater Chen

@sinat_28375239

已为社区贡献3条内容

目录

强化学习算法介绍