logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【GNN】第三章:传统图机器学习中的特征工程

因为每个点都不是孤立的,它都是和一些别的点有联系的,所以一个点的特征的变化是要受到和它有边相连的点的影响的。比如有的任务是求点的(比如对点进行分类、回归等任务),有的是求边的(比如对边进行分类、回归等任务),有的还是求全局的就是Graph级别的任务(比如设计分子结构等任务)。图是一个全局的概念。vi节点k跳远的邻接节点(neighbors with k-hop),指的是到节点vi走k步的节点(一个

文章图片
#自然语言处理#人工智能#深度学习 +4
【强化学习实战】第十一章:Gymnasium库的介绍和使用(1)、出租车游戏代码详解(Sarsa & Q learning)

本篇只讲如何使用gymnasium库中内置的游戏环境,并用Sarsa和Q-learning两种算法,展示出租车调度游戏案例。至于如何自定义强化学习环境,下一个篇章讲解。

文章图片
#游戏#深度学习#机器学习 +3
【强化学习】第九章:基于Action-Critic框架的强化学习:QAC、A2C、离轨AC方法

基于AC框架的强化学习方法是当前强化学习中最流行、最普遍的方法。基于AC框架的算法也层出不穷,比如:A2C、PPO、TRPO等算法。

文章图片
#动态规划#算法#python +2
​【GNN】第九章:序列图神经网络TGNN

所以交通道路的图的节点和边一般不会变,变的只是随时间节点的特征在变化,比如节点的车流随时间在变化。比如行为识别-手势识别,从手部区域提取20个点,这20个基本就是手部的每个骨关节,把这20个点看作是节点,节点和节点之间的连接不会发生变化,但节点和节点之间的距离会随着手的姿势的变动而变动,就可以看作是节点的特征是时序变化的。另外一种是随着时间的推移,图中的节点的个数都已经发生了变化,也就是data.

文章图片
#自然语言处理#深度学习#知识图谱 +2
【强化学习实战】第十二章:Gymnasium库的介绍和使用(2)、蛇棋游戏案例

上一个篇章讲了如何使用gymnasium库中内置的游戏环境,本篇讲如何自定义环境,并用一个蛇棋的小游戏展示说明。

文章图片
#游戏#人工智能#机器学习 +3
【强化学习】第六章:无模型控制:在轨MC控制、在轨时序差分学习(Sarsa)、离轨学习(Q-learning)

本篇的在轨MC控制、在轨算法:Sarsa、离轨算法Q-learning,这些算法的最终目标都是求最优策略的。本篇是DeepMind流派,或者说是强化学习鼻祖Rich Sutton和Andew Barto出版的强化学习那本书里的理论部分的最后一讲。所以本篇学完以后,你就可以把这些理论框架应用到实践过程中了。本篇之后我们开讲OpenAI流派,也就是深度强化学习。

文章图片
#学习#人工智能#深度学习 +3
【GNN】第八章:图神经网络架构中的基础设施——GCN、GAT、GraphSAGE、TopKPooling、GAP、GMP

本文系统介绍了图神经网络(GNN)中的核心层结构及其应用。重点解析了三种典型图卷积层:GCN(基于度矩阵加权)、GAT(引入注意力机制)和GraphSAGE(支持大规模图的采样聚合方法),详细阐述了它们的计算原理、特性差异及适用场景。同时深入讲解了TopKPooling剪枝池化层的工作原理,以及GAP/GMP全局池化层在图分类任务中的应用。

文章图片
#神经网络#架构#人工智能 +4
【深度学习】第五章:再次回看网络架构-激活函数-损失函数-梯度下降

再看反向传播,当relu把这个神经元的输出变成0后,那反向传播时它的梯度就是0了,那就意味着这个神经元的参数得不到更新了,参数不更新,意味着下次正向传播时还是上一轮的参数,所以大概率还是被relu变成0,就表示这个神经元不再相应后面的数据了,参数也就一直更新不了,很难再活过来。所以线性层后必有激活层,即使架构图没有标出,你也要知道一定是要有激活层的。输出层的激活函数也是根据任务设置的,而且还可以灵

文章图片
#深度学习#人工智能
【强化学习】第八章:基于策略的强化学习、REINFORCE

本章节讲基于策略的强化学习,是强化学习领域中的一个独立分支,也是强化学习领域的重要研究方向,目前是OpenAI和加州大学伯克利分校(UC Berkeley)在研究。

文章图片
#人工智能#深度学习#机器学习 +4
    共 59 条
  • 1
  • 2
  • 3
  • 6
  • 请选择