logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python-封装

python_封装案例

#python#linux#centos +2
机器学习-模型评估与选择(第2章)课后习题

机器学习-模型评估与选择(第2章)课后习题

文章图片
#机器学习#人工智能
论文解析-基于 Unity3D 游戏人工智能的研究与应用

论文解析-基于 Unity3D 游戏人工智能的研究与应用1.重写AgentAction 方法2.重写CollectObservations 方法3.重写CollectObservations 方法

#unity#深度学习
Linux-Ubuntu打开anaconda Navigator

Linux-Ubuntu打开anaconda Navigator 图形界面

#linux#ubuntu#centos +1
强化学习-深度Q网络(第3章)

强化学习-深度Q网络(第3章)深度 Q 网络 革新了强化学习领域。1.在连续控制问题中,不能用表格式的Q数组表示。2.DQN的一个有趣的特性是在训练过程中利用第二个网络,成为目标网络。第二个网络用于生成 target-Q值, 该 target-Q 值用于在训练过程中计算损失函数。3.DQNs 中的一个问题是使用 (𝑠,𝑎, 𝑟,𝑠′, done) 元组的连续样本, 它们是相关的, 因此训练

#深度学习#人工智能
强化学习-Double DQN、竞争网络结构和Rainbow(第4章)

强化学习-Double DQN、竞争网络结构和Rainbow(第4章)1.Double DQN、竞争网络结构和Rainbow2.思考题

#人工智能#python#深度学习
强化学习-深度Q网络(第3章)

强化学习-深度Q网络(第3章)深度 Q 网络 革新了强化学习领域。1.在连续控制问题中,不能用表格式的Q数组表示。2.DQN的一个有趣的特性是在训练过程中利用第二个网络,成为目标网络。第二个网络用于生成 target-Q值, 该 target-Q 值用于在训练过程中计算损失函数。3.DQNs 中的一个问题是使用 (𝑠,𝑎, 𝑟,𝑠′, done) 元组的连续样本, 它们是相关的, 因此训练

#深度学习#人工智能
Python-项目实战--贪吃蛇小游戏(1)

Python-项目实战--贪吃蛇小游戏(1)贪吃蛇的游戏规则类的设计与模块准备

#linux#ubuntu#python +2
Python-DQN代码阅读(13)

Python-DQN代码阅读(13)data = np.loadtxt('performance.txt')mva = np.zeros((data.shape[0]), dtype=np.float)mva[i] = data[i,1]mva[i] = alpha * data[i,1] + (1.0 - alpha) * mva[i-1]plt.plot(data[:,0], data[:,1

#python#深度学习#人工智能
Python-PyCharm调试时中文出现乱码

Python-PyCharm调试时中文出现乱码注意:勾选方框可以解决pycharm调试中文乱码的问题,但会导致其他软件出现乱码

#python#pycharm
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择