logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

tensorflow2 tf2 DDPG算法玩立棍小游戏

DDPG算法就不做过多解读了,就是用来进行连续值预测,本文是使用DDPG进行立棍小游戏,详细过程解读注释在代码中

#python#深度学习#keras
tensorflow2 tf2 PG算法 强化学习玩乒乓球

使用确定性策略梯度玩乒乓球,网上很多案例抄写下来,实际使用发现都无法收敛,花了很多时间纠错,然后从parl提供的代码作为核心参考,收集了其他案例中的优点,自己在tensorflow2中实现了算法,并测试成功收敛0.99累计奖励 + 0.01 最新奖励 = 1.0 时的训练结果图片环境:CPU: AMD Ryzen 9 5900XGPU: NVIDIA GeForce RTX 3090备注: 实际上

#算法#深度学习#人工智能
SpringBoot3 GraalVM 原生镜像打包 搭建云原生环境

java发布到如今,已经过去几十年,如今微服务、云原生逐渐成为了主流,java原本的很多优势不再重要,而启动慢,耗内存等的缺点也越来越被放大.java在新发布的很多相关技术中也做出了很多改变其中SpringBoot3结合GraalVM,可以直接将java项目打包成原生可执行文件,提升运行速度并大大节省服务资源,

文章图片
#java#spring boot#云原生
到底了