
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
tensorflow2 tf2 DDPG算法玩立棍小游戏
DDPG算法就不做过多解读了,就是用来进行连续值预测,本文是使用DDPG进行立棍小游戏,详细过程解读注释在代码中
tensorflow2 tf2 PG算法 强化学习玩乒乓球
使用确定性策略梯度玩乒乓球,网上很多案例抄写下来,实际使用发现都无法收敛,花了很多时间纠错,然后从parl提供的代码作为核心参考,收集了其他案例中的优点,自己在tensorflow2中实现了算法,并测试成功收敛0.99累计奖励 + 0.01 最新奖励 = 1.0 时的训练结果图片环境:CPU: AMD Ryzen 9 5900XGPU: NVIDIA GeForce RTX 3090备注: 实际上
SpringBoot3 GraalVM 原生镜像打包 搭建云原生环境
java发布到如今,已经过去几十年,如今微服务、云原生逐渐成为了主流,java原本的很多优势不再重要,而启动慢,耗内存等的缺点也越来越被放大.java在新发布的很多相关技术中也做出了很多改变其中SpringBoot3结合GraalVM,可以直接将java项目打包成原生可执行文件,提升运行速度并大大节省服务资源,

到底了