
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
POMDP做自动驾驶决策算法的思路
本文整理一下个人对基于POMDP深度强化学习的方法做自动驾驶决策算法的一些理解。在EUDM和MPDM等自动驾驶决策算法中,都提到了Forward Simulation前向搜索的过程,该过程可以在Alpha Go & Alpha Zero中的MCTS蒙特卡洛树搜索算法中获得启发。前向搜索过程每一步都要罗列出全部的可能的决策,即使某种决策的概率很小。而MCTS可以通过减小搜索广度和深度,来有效降低前向

到底了







