logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AlphaGo Zero是如何工作的?——AlphaGo Zero背后的强化学习算法原理

  Deepmind公司的AlphaGo算法是第一个打败人类选手的围棋程序。2016年三月,打败李世石的是AlphaGo Lee,一个靠大量人类围棋专家的棋谱进行监督学习和自对弈强化学习进行训练的AI程序。不久之后,deepmind的新论文展示了不同于之前AlphaGo的全新网络结构——它仅仅用了三天的自对弈强化学习而无需人类的下棋经验就以100-0的战绩打败了AlphaGo。它就是大名鼎鼎的Al

#深度学习
深度学习之caffe入门——cifar10例程

2017年3月11日23:55cifar10是caffe自带的第二个比较有趣的例程。readme文档的翻译进行神经网络的训练全过程。

#深度学习
强化学习经典算法笔记(二十一):gym-super-mario-bros游戏环境笔记

gym-super-mario-bros游戏环境笔记gym-super-mario-bros游戏环境笔记简介安装DemoGym demo命令行demo环境单独关卡随机选择关卡奖励函数info内容解读gym-super-mario-bros游戏环境笔记最近在学习Intrinsic Reward Model相关的paper,super-mario-bros可以说是算法性能测试的标配游戏环境了,可惜之前

#游戏#深度学习#pytorch +1
深度学习之群卷积(Group Convolution)

最近在看MSRA的王井东研究员的《Interleaved Group Convolutions for Deep Neural Networks》。论文中多次提到群卷积这个概念,所以特地学习了一下群卷积。群卷积最早出现于AlexNet中。是为了解决显存不够的问题,将网络部署在两张GTX 580显卡上训练,Alex认为group conv的方式能够增加 filter之间的对角相关性,而且能够减少..

#深度学习
强化学习经典算法笔记(二十):交叉熵方法Cross Entropy Method

强化学习经典算法笔记(二十):交叉熵方法Cross Entropy Method本次补上一个经典RL算法笔记。感谢 https://the0demiurge.blogspot.com/2017/08/cross-entropy-method-cem.html感谢 https://en.wikipedia.org/wiki/Cross-entropy_methodCEM基本概念:交叉熵方法是一种蒙特

#机器学习#深度学习
3ds max下载

下载https://www.3d66.com/softhtml/showsoft_355.html#downaddr破解http://www.3dmax8.com/3dmax/2018/0121/7943.html

强化学习经典算法笔记(二十一):gym-super-mario-bros游戏环境笔记

gym-super-mario-bros游戏环境笔记gym-super-mario-bros游戏环境笔记简介安装DemoGym demo命令行demo环境单独关卡随机选择关卡奖励函数info内容解读gym-super-mario-bros游戏环境笔记最近在学习Intrinsic Reward Model相关的paper,super-mario-bros可以说是算法性能测试的标配游戏环境了,可惜之前

#游戏#深度学习#pytorch +1
强化学习经典算法笔记(二十一):gym-super-mario-bros游戏环境笔记

gym-super-mario-bros游戏环境笔记gym-super-mario-bros游戏环境笔记简介安装DemoGym demo命令行demo环境单独关卡随机选择关卡奖励函数info内容解读gym-super-mario-bros游戏环境笔记最近在学习Intrinsic Reward Model相关的paper,super-mario-bros可以说是算法性能测试的标配游戏环境了,可惜之前

#游戏#深度学习#pytorch +1
强化学习经典算法笔记(二十):交叉熵方法Cross Entropy Method

强化学习经典算法笔记(二十):交叉熵方法Cross Entropy Method本次补上一个经典RL算法笔记。感谢 https://the0demiurge.blogspot.com/2017/08/cross-entropy-method-cem.html感谢 https://en.wikipedia.org/wiki/Cross-entropy_methodCEM基本概念:交叉熵方法是一种蒙特

#机器学习#深度学习
    共 14 条
  • 1
  • 2
  • 请选择