supergreener 个人主页

supergreener

2023-02-21 19:54:07 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

breakout-v0的action_space有4个动作，分别是0-NOOP,1-FIRE,2-RIGHT,3-LEFT。之前一直以为环境默认发出小球供击打，其实发出小球需要智能体做出动作1-FIRE。而我的模型没有学会在一小轮失败后做出动作1，故一直环境停滞不前。

到底了