登录社区云,与社区用户共同成长
邀请您加入社区
该用户还未填写简介
暂无可提供的服务
许多书上都回答过这个问题,基本答案都是——“试错”和“延迟回报”是强化学习两个最重要的特征。但是这里从更高的层次来看待这个问题,或许会给我们不同的启示~~其中最重要的就是强化学习的“整体性”这一特征。强化学习明确考虑了目标导向的智能体与不确定的环境交互的整个问题。与其他机器学习方法不同,比如监督学习只关注模型的构建,规划理论只强调了规划的实现,没有考虑实时决策的过程等等,这些机器学习方法都是关注的