
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
查看GPU的使用情况及输出详解1. 查看GPU的使用情况1.1nvidia-smi1.2nvidia-smi -l1.3watch -n 1 nvidia-smi2. 输出详解2.1 标题部分2.2 GPU 信息部分2.3 性能和功耗部分2.4 内存和利用率部分2.5 进程部分
机器学习-模型评估与选择(第2章)课后习题

论文解析-基于 Unity3D 游戏人工智能的研究与应用1.重写AgentAction 方法2.重写CollectObservations 方法3.重写CollectObservations 方法
Linux-Ubuntu打开anaconda Navigator 图形界面
强化学习-深度Q网络(第3章)深度 Q 网络 革新了强化学习领域。1.在连续控制问题中,不能用表格式的Q数组表示。2.DQN的一个有趣的特性是在训练过程中利用第二个网络,成为目标网络。第二个网络用于生成 target-Q值, 该 target-Q 值用于在训练过程中计算损失函数。3.DQNs 中的一个问题是使用 (𝑠,𝑎, 𝑟,𝑠′, done) 元组的连续样本, 它们是相关的, 因此训练
强化学习-Double DQN、竞争网络结构和Rainbow(第4章)1.Double DQN、竞争网络结构和Rainbow2.思考题
强化学习-深度Q网络(第3章)深度 Q 网络 革新了强化学习领域。1.在连续控制问题中,不能用表格式的Q数组表示。2.DQN的一个有趣的特性是在训练过程中利用第二个网络,成为目标网络。第二个网络用于生成 target-Q值, 该 target-Q 值用于在训练过程中计算损失函数。3.DQNs 中的一个问题是使用 (𝑠,𝑎, 𝑟,𝑠′, done) 元组的连续样本, 它们是相关的, 因此训练
Python-项目实战--贪吃蛇小游戏(1)贪吃蛇的游戏规则类的设计与模块准备
Python-DQN代码阅读(13)data = np.loadtxt('performance.txt')mva = np.zeros((data.shape[0]), dtype=np.float)mva[i] = data[i,1]mva[i] = alpha * data[i,1] + (1.0 - alpha) * mva[i-1]plt.plot(data[:,0], data[:,1







