q774798577 个人主页

@q774798577

q774798577

2023-01-02 12:43:21 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

python基础知识

人工智能数学基础

人工智能数学基础

所谓强化学习（Reinforcement Learning,简称RL），是指基于智能体在复杂、不确定的环境中最大话它能获得的奖励，从而达到自主决策的目的。经典的强化学习模型可以总结为下图的形式（智能体、行为、环境、状态、奖励）：我们知道目前主流的深度学习网络是基于仿生学模仿人脑神经元建立的。而强化学习模仿的是智能体与环境的交互。如上图：Agent：智能体。Environment,即环境。Actio

人工智能数学基础

人工智能数学基础

人工智能数学基础

到底了