logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习:随机策略梯度,AC家族(AC,A2C,A3C)

根据策略是随机策略还是确定性策略,分为策略梯度方法(SPG,用PG表示)和确定性策略梯度方法(DPG)。因为,随机策略梯度方法(SPG)存在学习率难以确定的问题,就有了置信域策略优化(TRPO),它能够确定一个使得回报函数单调不减的最优步长。确定性策略梯度方法(DPG)使用的是线性函数逼近行为值函数和确定性策略,如果将线性函数扩展到非线性函数——深度神经网络,就有了深度确定性策略梯度方法(DDPG

文章图片
#机器学习
多智能体通信:基于通信的多智能体强化学习研究综述

题目:A Survey of Multi-Agent Reinforcement Learning with Communication出处:arXiv 2022摘要:通信是协调多个智能体行为的有效机制。在多智能体强化学习领域,智能体可以通过通信来提高整体学习性能并实现其目标。此外,智能体可以通过特定渠道向所有智能体或特定智能体组传递各种类型的消息。随着越来越多的通讯研究工作(Comm MARL)

#学习
LLM:NLP,LM,seq2seq,ELMo

2w字吐血整理,GPT入门材料(NLP,LM,词嵌入,Word2vec,N-gram,基于RNN的语言模型,seq2seq,Decoder结构,Attention,自监督学习,预训练)。包括:基础知识,底层原理,数学公式表示,刁钻问题解答。

文章图片
#学习
强化学习:在表征空间中进行新颖性搜索以实现样本的高效探索

题目:Novelty Search in Representational Space for Sample Efficient Exploration出处:Neural Information Processing Systems (NeurIPS,2020),人工智能领域顶级会议。摘要:我们提出了一种新的有效探索方法,该方法利用所学环境的低维编码,并结合基于模型和无模型的目标。我们的方法使用基

#机器学习
强化学习:随机策略梯度,AC家族(AC,A2C,A3C)

根据策略是随机策略还是确定性策略,分为策略梯度方法(SPG,用PG表示)和确定性策略梯度方法(DPG)。因为,随机策略梯度方法(SPG)存在学习率难以确定的问题,就有了置信域策略优化(TRPO),它能够确定一个使得回报函数单调不减的最优步长。确定性策略梯度方法(DPG)使用的是线性函数逼近行为值函数和确定性策略,如果将线性函数扩展到非线性函数——深度神经网络,就有了深度确定性策略梯度方法(DDPG

文章图片
#机器学习
机器学习:支持向量机(SVM)

支持向量机(SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,可以将问题化为一个求解凸二次规划的问题。与逻辑回归和神经网络相比,支持向量机,在学习复杂的非线性方程时提供了一种更为清晰,更加强大的方式。

文章图片
#机器学习
机器学习:Rademacher复杂度

在机器学习中,模型的泛化能力是一个核心问题,而Rademacher复杂度是一种强大的工具,用于衡量学习算法对随机噪声的拟合能力,从而评估其泛化误差。本博客将深入探讨Rademacher复杂度的概念、数学定义,并结合实际案例分析其在学习理论中的重要作用。

文章图片
#机器学习#人工智能#深度学习
机器学习:感知机算法(PLA)

感知机(Perceptron)是一种最简单的人工神经网络模型,由弗兰克·罗森布拉特(Frank Rosenblatt)在1958年提出。它是一种线性分类器,用于二分类任务,即把输入数据分为两个类别。

文章图片
#机器学习
机器学习:梯度下降,次梯度,随机梯度下降

梯度下降(Gradient Descent)是机器学习中最常见的优化算法之一,广泛用于模型训练和参数优化。本篇博客介绍梯度下降的基本原理,并深入探讨 批量梯度下降(GD)、随机梯度下降(SGD) 及 次梯度方法(Subgradient Method) 的区别与应用。我们将分析不同算法在 收敛速度、计算成本、稳定性 等方面的表现,并结合实际案例,帮助读者理解如何选择最适合的优化策略,以应对不同的机器

文章图片
#机器学习
机器学习:聚类(层次聚类,密度聚类,K-means,谱聚类)

机器学习中的聚类是一种无监督学习方法,主要用于数据分组。常见的聚类算法包括:层次聚类(构建树状层次结构)、密度聚类(如DBSCAN,基于数据密度发现聚类)、K-means(通过迭代优化簇中心划分数据)、谱聚类(利用图论和特征分解进行聚类)。不同算法适用于不同场景,理解它们的特点有助于选择最合适的聚类方法。

文章图片
#机器学习
    共 91 条
  • 1
  • 2
  • 3
  • 10
  • 请选择