logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习极简入门

所谓强化学习(Reinforcement Learning,简称RL),是指基于智能体在复杂、不确定的环境中最大话它能获得的奖励,从而达到自主决策的目的。经典的强化学习模型可以总结为下图的形式(智能体、行为、环境、状态、奖励):我们知道目前主流的深度学习网络是基于仿生学模仿人脑神经元建立的。而强化学习模仿的是智能体与环境的交互。如上图:Agent:智能体。Environment,即环境。Actio

文章图片
#人工智能#深度学习
强化学习极简入门

所谓强化学习(Reinforcement Learning,简称RL),是指基于智能体在复杂、不确定的环境中最大话它能获得的奖励,从而达到自主决策的目的。经典的强化学习模型可以总结为下图的形式(智能体、行为、环境、状态、奖励):我们知道目前主流的深度学习网络是基于仿生学模仿人脑神经元建立的。而强化学习模仿的是智能体与环境的交互。如上图:Agent:智能体。Environment,即环境。Actio

文章图片
#人工智能#深度学习
到底了