logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【多智能体强化学习环境】SMAC环境配置安装

文章目录引子开始安装github上拉取文件修改install_sc2.sh文件安装SMAC手动安装SMAC地图包引子本文主要介绍多智能体强化学习环境:星际争霸二(SMAC)在linux环境docker上得安装。这里安装的环境来自这个链接:https://github.com/oxwhirl/pymarl因为我们在服务器上一般只有一个属于自己的docker,而且碍于网络问题,直接按照github上的

微机原理与嵌入式系统实验——基于Keil µVision5 Simulator的自主实验(在实验中熟悉MDK、STM32)

这是中科大2020春季《微机原理与嵌入式系统》课程实验,是今年特殊情况(疫情无法上机的特制版实验)。MDK下载安装打开链接http://www2.keil.com/mdk5,选择下载有可能会需要填写一些信息,这一步应该可以随便填。会自动跳转到下载页面,下载MDK530.EXE可能会有些慢,如果有vpn可能会快一些。下载好exe文件以后打开直接安装,一路默认设置下来即可,中间可能又要填一下姓名、邮箱

【论文笔记】RODE:为agent分配角色

文章目录引子模型结构介绍(a) 学习动作编码方式(b) 角色选择器表征(c ) 角色策略训练(d) 整体架构实验及消融实验总结引子论文标题:RODE: LEARNING ROLES TO DECOMPOSE MULTI-AGENT TASKS,ICLR2021。RODE的名字取自role的ro和decompose的de。论文链接:(ICLR 2021, https://arxiv.org/abs/

文章图片
【论文笔记】AAAI2022论文精读-AlphaHoldem

修改自我组会报告,具体细节请读原文。文章目录引子背景介绍德州扑克规则论文贡献信息编码方式网络结构自博弈算法性能比较引子论文标题是:AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Texas Hold’em from End-to-End Reinforcement Learning在写这篇文章的

文章图片
到底了