logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

搭建强化学习训练环境遇到的小问题

对于搭建tensorflow遇到的conda和docker相关问题总结

#机器学习#python#tensorflow
博弈对抗游戏AI的技术方法的一些总结和思考

主要分类为四种游戏模式:棋盘游戏AI、纸牌游戏AI、FPS游戏AI、RTS游戏AI。棋牌游戏AIAlphaGo是最基础的一个游戏AI,因此主要了解AlphaGo的基本原理。简单概括为:在MCTS的框架下引入两个卷积神经网络policy network和value network以改进纯随机的Monte Carlo模拟,并借助监督学习和强化学习训练这两个网络。结合AlphaGo讲解MCTShttps

#人工智能#游戏
到底了