logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

POMDP做自动驾驶决策算法的思路

本文整理一下个人对基于POMDP深度强化学习的方法做自动驾驶决策算法的一些理解。在EUDM和MPDM等自动驾驶决策算法中,都提到了Forward Simulation前向搜索的过程,该过程可以在Alpha Go & Alpha Zero中的MCTS蒙特卡洛树搜索算法中获得启发。前向搜索过程每一步都要罗列出全部的可能的决策,即使某种决策的概率很小。而MCTS可以通过减小搜索广度和深度,来有效降低前向

文章图片
#自动驾驶#动态规划#算法
到底了