
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近准备把之前看过的MARL相关文章重新捡起来,一方面是综述,一方面是具体方法。因为我本人课题中的一部分使用了QMIX做应用,为之后思考可以改进的idea做准备。所以借这篇文章的机会重新回顾一下值分解的相关方法,本文先总结VDN/QMIX/QTRAN/Qatten这四篇文章,主要对每一篇文章中的理论及方法进行总结,尽量讲清楚这些方法的motivation,针对的具体问题,理论及从理论推导出的算法,
MADDPG算法介绍MADDPG代码分析与实验
MADDPG算法介绍MADDPG代码分析与实验
概述本文介绍了单步q-learning和sarsa的原理和python实现(按照莫烦强化学习中的代码重新敲了一遍),基于eligibility trace1. Q-learning 算法原理2. SARSA算法原理3. Q-learning与SARSA的不同之处4. Q-learning python 实现5. SARSA python实现...
MADDPG算法介绍MADDPG代码分析与实验
最近准备把之前看过的MARL相关文章重新捡起来,一方面是综述,一方面是具体方法。因为我本人课题中的一部分使用了QMIX做应用,为之后思考可以改进的idea做准备。所以借这篇文章的机会重新回顾一下值分解的相关方法,本文先总结VDN/QMIX/QTRAN/Qatten这四篇文章,主要对每一篇文章中的理论及方法进行总结,尽量讲清楚这些方法的motivation,针对的具体问题,理论及从理论推导出的算法,
本博客对应我博客中的多变量微积分目录下的第一章,向量和矩阵。1.向量和矩阵(Vectors and Matrices)——开启多变量函数和多变量微积分大门的钥匙在单变量微积分中用得最多的应该只是坐标,如果想要进入三维的世界,就需要引入向量,甚至是矩阵来简化我们的运算过程,例如,一个函数在坐标轴的三个基底向量上都是随自变量变化的函数,那么每一次运算都把他们单独写出来是肯定很麻烦的,这时候不妨试试..
文章目录0. 写在前面1. 一些关于级数的基本概念:1.1 什么是无穷级数1.2 级数和积分的联系个人理解级数和积分的对比1.3 级数的收敛1.4 级数举例a. 几何级数b. 调和级数c. p级数d. 幂级数及其收敛半径2. 特殊的幂级数——泰勒展开2.1函数的幂级数表达2.2 泰勒公式泰勒级数特殊情况——麦克劳林公式2.3 简单证明2.4 指数函数,三角函数的泰勒展开3. 欧拉公式的证明参考0.
文章目录1. 特殊算式表达1.1爱因斯坦求和符号1.2 Levi-Civita符号(叉乘)2. 曲线坐标基向量对应直角坐标的函数表达2.1 柱坐标2.2 球坐标3. 直角坐标系下的线元,面元,体元4. 直角坐标系到曲线坐标系的变换5. 坐标系下的线元,面元,体元表达形式5.15.25.36. 曲线坐标系下梯度表达数学物理方法的前几节课1. 特殊算式表达1.1爱因斯坦求和符号1.2 Levi...
昨天装完了ubuntu 16.04,之前毕业设计用的tensorflow,但深度学习这门课的作业项目不大,就打算装一下Pytorch,这篇文章总结一下。主要参考了这篇博客:ubuntu16.04 + Anaconda + CUDA10 + cudnn + pytorch + pycharm1.创建单独的Anaconda环境!!单独的Python环境真的比较重要,我这里创建了python 3....







