logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多智能体深度强化学习值分解方法总结(1)——VDN/QMIX/QTRAN/Qatten

最近准备把之前看过的MARL相关文章重新捡起来,一方面是综述,一方面是具体方法。因为我本人课题中的一部分使用了QMIX做应用,为之后思考可以改进的idea做准备。所以借这篇文章的机会重新回顾一下值分解的相关方法,本文先总结VDN/QMIX/QTRAN/Qatten这四篇文章,主要对每一篇文章中的理论及方法进行总结,尽量讲清楚这些方法的motivation,针对的具体问题,理论及从理论推导出的算法,

#人工智能#机器学习#算法
多变量微积分笔记(1)——向量和矩阵

本博客对应我博客中的多变量微积分目录下的第一章,向量和矩阵。1.向量和矩阵(Vectors and Matrices)——开启多变量函数和多变量微积分大门的钥匙在单变量微积分中用得最多的应该只是坐标,如果想要进入三维的世界,就需要引入向量,甚至是矩阵来简化我们的运算过程,例如,一个函数在坐标轴的三个基底向量上都是随自变量变化的函数,那么每一次运算都把他们单独写出来是肯定很麻烦的,这时候不妨试试..

单变量微积分笔记——无穷级数,泰勒展开及欧拉公式的证明

文章目录0. 写在前面1. 一些关于级数的基本概念:1.1 什么是无穷级数1.2 级数和积分的联系个人理解级数和积分的对比1.3 级数的收敛1.4 级数举例a. 几何级数b. 调和级数c. p级数d. 幂级数及其收敛半径2. 特殊的幂级数——泰勒展开2.1函数的幂级数表达2.2 泰勒公式泰勒级数特殊情况——麦克劳林公式2.3 简单证明2.4 指数函数,三角函数的泰勒展开3. 欧拉公式的证明参考0.

R3空间曲线坐标系变换及向量分析

文章目录1. 特殊算式表达1.1爱因斯坦求和符号1.2 Levi-Civita符号(叉乘)2. 曲线坐标基向量对应直角坐标的函数表达2.1 柱坐标2.2 球坐标3. 直角坐标系下的线元,面元,体元4. 直角坐标系到曲线坐标系的变换5. 坐标系下的线元,面元,体元表达形式5.15.25.36. 曲线坐标系下梯度表达数学物理方法的前几节课1. 特殊算式表达1.1爱因斯坦求和符号1.2 Levi...

ubuntu 16.04和win 10(用pip) pytorch GPU版本安装总结

昨天装完了ubuntu 16.04,之前毕业设计用的tensorflow,但深度学习这门课的作业项目不大,就打算装一下Pytorch,这篇文章总结一下。主要参考了这篇博客:ubuntu16.04 + Anaconda + CUDA10 + cudnn + pytorch + pycharm1.创建单独的Anaconda环境!!单独的Python环境真的比较重要,我这里创建了python 3....

#pytorch#ubuntu#深度学习
PreScan笔记(1)——入坑之简单介绍和Demo

这里写自定义目录标题PreScan 小白入坑1. PreScan简单介绍2. First Demo简单介绍实验的基本四步第一个demo——与MATLAB连接过程中的问题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表

多智能体深度强化学习值分解方法总结(1)——VDN/QMIX/QTRAN/Qatten

最近准备把之前看过的MARL相关文章重新捡起来,一方面是综述,一方面是具体方法。因为我本人课题中的一部分使用了QMIX做应用,为之后思考可以改进的idea做准备。所以借这篇文章的机会重新回顾一下值分解的相关方法,本文先总结VDN/QMIX/QTRAN/Qatten这四篇文章,主要对每一篇文章中的理论及方法进行总结,尽量讲清楚这些方法的motivation,针对的具体问题,理论及从理论推导出的算法,

#人工智能#机器学习#算法
多智能体深度强化学习值分解方法总结(1)——VDN/QMIX/QTRAN/Qatten

最近准备把之前看过的MARL相关文章重新捡起来,一方面是综述,一方面是具体方法。因为我本人课题中的一部分使用了QMIX做应用,为之后思考可以改进的idea做准备。所以借这篇文章的机会重新回顾一下值分解的相关方法,本文先总结VDN/QMIX/QTRAN/Qatten这四篇文章,主要对每一篇文章中的理论及方法进行总结,尽量讲清楚这些方法的motivation,针对的具体问题,理论及从理论推导出的算法,

#人工智能#机器学习#算法
单变量微积分笔记——导数的应用

本文内容对应我的博客中微积分笔记总目录下的第二章,导数和微分的应用。2. 导数和微分的应用(Applications)本章主要总结一些导数的应用和一条与导数有关的定理(中值定理)2.1 线性和二次近似(Linear and Quadratic Approximation)2.1.1 线性近似什么是线性近似?如果已知函数 f(x)f(x)f(x) 的某一点坐标 (x0, f(x...

    共 22 条
  • 1
  • 2
  • 3
  • 请选择