强化学习算法介绍对比学习一:sarsaQ-learningDQNpolicy gradientDDPGActor-CriticSoft Actor-CriticA3CPPO离散:DQN连续:DDPG
对比学习一:
DQN
policy gradient
DDPG
Actor-Critic
Soft Actor-Critic
A3C
PPO
离散:DQN
连续:DDPG
腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。
更多推荐
DeepSeek 大爆发,带来了哪些新希望?
李建忠:智能体正将互联网从信息网络重构为行动网络
探秘 DeepSeek 落地进展,腾讯云携手业界专家共话 AI 生产力
扫一扫分享内容
登录社区云,与社区用户共同成长
邀请您加入社区
所有评论(0)