
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
InforMARL解读:Dec-POMDP图信息聚合
论文提出了一种基于图神经网络(GNN)的可扩展多智能体强化学习方法InforMARL,通过智能信息聚合解决局部观测下的协作问题。该方法使用GNN聚合Actor和Critic的局部信息,采用注意力机制选择重要邻居信息,并通过多层网络实现高阶信息传播。在集中训练分布式执行(CTDE)框架下,Critic使用图信息聚合模块处理可变数量智能体。实验在四种导航任务中验证了该方法的有效性,结果表明仅使用局部信

到底了







