半衍丶浔洇个人主页

@FragranceYx

半衍丶浔洇

2023-08-01 19:41:18 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

POMDP做自动驾驶决策算法的思路

本文整理一下个人对基于POMDP深度强化学习的方法做自动驾驶决策算法的一些理解。在EUDM和MPDM等自动驾驶决策算法中，都提到了Forward Simulation前向搜索的过程，该过程可以在Alpha Go & Alpha Zero中的MCTS蒙特卡洛树搜索算法中获得启发。前向搜索过程每一步都要罗列出全部的可能的决策，即使某种决策的概率很小。而MCTS可以通过减小搜索广度和深度，来有效降低前向

#自动驾驶 #动态规划 #算法

到底了