贰锤个人主页

@weixin_37895339

贰锤

2022-12-19 16:18:26 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

多智能体强化学习入门（六）——MFMARL算法（Mean Field Multi-Agent RL）

本节内容见https://zhuanlan.zhihu.com/p/56049023

#深度学习

多智能体强化学习入门（五）——QMIX算法分析

本文内容见https://zhuanlan.zhihu.com/p/55003734

正态分布与均匀分布之间的变换

一、任何分布都能化为[0,1][0,1][0,1]均匀分布　　假设FX(a)=p(x≤a)FX(a)=p(x≤a)F_X(a)=p(x\le a)为累积分布函数，f(x)f(x)f(x)为概率密度函数，FX(a)=∫a−∞f(x)dxFX(a)=∫−∞af(x)dxF_X(a)=\int_{-\infty}^af(x)dx，则存在如下等式　　P(FX(X)≤a)=P(X≤F−1X(a))=...

多智能体强化学习入门（八）——图卷积强化学习DGN

GRAPH CONVOLUTIONAL REINFORCEMENT LEARNING文章在https://zhuanlan.zhihu.com/p/143816617

#机器学习 #人工智能

机器学习—近似误差与估计误差理解

近似误差：可以理解为对现有训练集的训练误差。估计误差：可以理解为对测试集的测试误差。近似误差关注训练集，如果近似误差小了会出现过拟合的现象，对现有的训练集能有很好的预测，但是对未知的测试样本将会出现较大偏差的预测。模型本身不是最接近最佳模型。估计误差关注测试集，估计误差小了说明对未知数据的预测能力好。模型本身最接近最佳模型。...

#机器学习

多智能体强化学习入门（一）——基础知识与博弈

本次开一个专栏，用来分享关于多智能体强化学习方面的入门内容。强化学习在单体稳定环境中取得了非常好的效果，DeepMind，OpenAI目前都在把眼光投向了多智能体强化学习，尤其是分布式的算法。本节内容分享在https://zhuanlan.zhihu.com/p/53474965。...

机器学习—近似误差与估计误差理解

#机器学习

多智能体强化学习入门（七）——AC for CDec-POMDP 大规模规划学习算法

Thien, Nguyen & Kumar, Akshat & Lau, Hoong. (2017). Policy Gradient With Value Function Approximation For Collective Multiagent Planning.内容详见：https://zhuanlan.zhihu.com/p/66571753

#深度学习 #机器学习

多智能体强化学习入门（三）——矩阵博弈中的分布式学习算法

本节内容在https://zhuanlan.zhihu.com/p/53622102

多智能体强化学习入门（六）——MFMARL算法（Mean Field Multi-Agent RL）

本节内容见https://zhuanlan.zhihu.com/p/56049023

#深度学习

共 14 条

请选择