
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
强化学习DQN算法
DQN概述DQN简述DQN算法主要的算法流程是将神经网络与Q-learning算法结合。利用神经网络强大的表征能力,将高维的输入数据作为强化学习中的state,作为神经网络模型(Agent)的输入; 随后神经网络模型输出每个动作对应的价值(Q值),得到将要执行的动作。强化学习的目标是通过学习从而获得最大的奖励。接下来将分成神经网络近似价值函数、求解价值网络以及DQN算法效果3个方面简要概述1. 神
机器学习(西瓜书)——读书笔记
第一章 绪论第一章主要介绍了机器学习的一些基本的概念,讲到了一些基本术语和相关的发展历程和应用的现状1.基本术语示例/样本:数据集的每条关于一个事件或者对象的描述属性/特征:反应事件在某方面的表现或性质的事项属性值:属性的取值属性空间/样本空间:属性张成的空间维数:数据集中每个示例由d个属性描述,d称为维数标记:训练样本中的结果样例(example):用药后标记信息的示例学习任务分类预测的值是离散
到底了







