logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

卷积神经网络CNN

1.卷积层cs231n课程中有一张卷积动图,貌似是用d3js 和一个util 画的,我根据cs231n的卷积动图依次截取了18张图,然后用一gif 制图工具制作了一gif 动态卷积图。如下gif 图所示(先相乘再相加)其中图像有三个通道,卷积核也有3通道(每一个卷积核)7*7*3的含义(其中7*7代表图像的像素/长宽,3代表R、G、B 三个颜色通道)两个神经元,即depth=2,意味着有两个滤波器

文章图片
#神经网络#cnn#深度学习
一文彻底搞懂Transformer - FFNN(前馈神经网络)

虽然FFN的输入输出维度都是512,但是输出的512维度特征和输入的512为特征是不一样的。但很多时候512维不够用,我们希望模型可以提取出更多维度的特征,于是,通过 FFN 两个相邻 FC 层的运算,可以将 512 维扩展到2048维( FFN 的隐层),随后再降维到512维作为 FFN 的输出。因为 FFN 层由两个线性变换层(FC)和一个非线性激活函数(ReLU)组成,通过在两个 FC 中间

文章图片
#transformer#神经网络#深度学习
ADAM的局限性

Adam 算法在许多情况下都能快速收敛,特别是在处理大规模数据和复杂模型时表现出更高的效率和稳定性。尽管存在一些缺点,但其在实际应用中表现出了优异的性能,特别是在需要快速得到结果的场景中。Adam 算法在某些情况下可能会出现震荡现象,影响收敛速度。

文章图片
#算法#机器学习#人工智能 +1
一文彻底搞懂Transformer - FFNN(前馈神经网络)

虽然FFN的输入输出维度都是512,但是输出的512维度特征和输入的512为特征是不一样的。但很多时候512维不够用,我们希望模型可以提取出更多维度的特征,于是,通过 FFN 两个相邻 FC 层的运算,可以将 512 维扩展到2048维( FFN 的隐层),随后再降维到512维作为 FFN 的输出。因为 FFN 层由两个线性变换层(FC)和一个非线性激活函数(ReLU)组成,通过在两个 FC 中间

文章图片
#transformer#神经网络#深度学习
动态的链路预测问题

1.1 静态网络的链路预测大多数算法都是将静态网络在特定时间段内进行预测,从而忽略了网络的时间特性。在静态网络中,链路预测是对网络中某一时刻缺少的链路进行预测,以获得网络的全貌2.2 Temporal Link Prediction: Problem Definition时间链路预测定义让G = (V, E)是一个动态的网络,V是顶点的集合和每条边(u, V) E代表u和V之间的联系的快照G表示为

文章图片
#算法#神经网络
SCAFFOLD: Stochastic Controlled Averaging for Federated Learning

选项I涉及对本地数据进行额外的传递,以计算服务器模型x的梯度。选项II则重用先前计算的梯度来更新控制变量。根据应用程序的不同,选项I可能比选项II更稳定,但选项II的计算成本更低,而且通常足够(我们所有的实验都使用选项II)。这就完成了一轮通信。注意,SCAFFOLD中的客户机是有状态的,并且在多个回合中保留ci的值。此外,如果ci总是被设置为0,那么SCAFFOLD就等同于FEDAVG。在算法1

文章图片
#算法
链路预测的定义与方法

动态网络的链路随时间的增加而变化,连边使其预测比静态网络更具挑战,如何准确地预测动态网络中潜在的或未来的链路已经受到了广泛地关注现有的许多动态网络链路预测方法利用历史网络信息并将其压缩成一个网络来预测下一时刻的网络结构。最典型的方法是基于相似性的动态链路预测,最常见的比如共同邻居CN等.基于机器学习的方法也应用于计算链路预测的最佳相似性,但通常优化方法的计算复杂度较高,容易受到现有的相似性指标的限

#html5#算法#html
到底了