logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM-分布式训练工具(一):DeepSpeed【微软】【大模型分布式训练工具,实现ZeRO并行训练算法】【zero3配置将模型参数切分后分配到不同的显卡中,突破单张显卡容量不足以加载模型参数的限制】

DeepSpeed是微软推出的大规模模型分布式训练的工具,主要实现了ZeRO并行训练算法。本文是huggingface的DeepSpeed文档的笔记,做查询和备忘,初次学习建议结合原始文档食用。

文章图片
#分布式#算法#python
PyTorch训练(四):Ring-Allreduce【分布式训练模式】

当将神经网络的训练并行化到许多GPU上时,你必须选择如何将不同的操作分配到你可用的不同GPU上。在这里,我们关注一种称为数据并行随机梯度下降( SGD )的技术。与标准SGD一样,梯度下降是通过数据子集(小批次)完成的,需要多次迭代才能在整个数据集上进行。然而,在数据并行训练中,每个GPU都有整个神经网络模型的完整副本,对于每次迭代,只分配了小批次中样本的子集。对于每次迭代,每个GPU在其数据上运

#pytorch#深度学习#神经网络
Colab实用教程(免费的深度学习GPU环境)

一、Colab是什么?Google Colab 是一个免费的云服务并支持免费的 GPU,可以:提高你的 Python 语言的编码技能。使用 Keras、TensorFlow、PyTorch 和 OpenCV 等流行库开发深度学习应用程序。Colab 与其它免费的云服务最重要的区别在于:Colab 提供完全免费的 GPU,对学生党进行AI学习提供便利。Colab 是Google的且服务器在国外如果不

Pytorch分布式训练框架Accelerate的main_process_ip参数是什么

Accelerate是一个高级的 PyTorch 分布式训练框架,它通过使用 PyTorch 的。在使用 Accelerate 进行分布式训练时,需要指定主进程的 IP 地址,以便其他进程可以连接到主进程并进行通信。注意,这个示例中还使用了其他 Accelerate 的功能,例如。模块来实现分布式训练,并提供了许多额外的功能,例如混合精度训练和自动调整学习率。参数在 Accelerate 中用于指

文章图片
#pytorch#分布式#tcp/ip
win10安装tensorflow-gpu-1.15

因课程要求,需要安装tensorflow1.15。我是使用conda来管理不同环境的。

#tensorflow#python#深度学习
深度学习-生成模型:AutoEncoder模型(Encoder-Decoder框架==Embedding+Generator)【Variational AutoEncoder已被GAN取代】

人工智能-机器学习-深度学习-损失函数优化方法:梯度下降算法的进化参考资料:一个框架看懂优化算法之异同 SGD/AdaGrad/Adam

#人工智能#机器学习#深度学习
联邦学习【分布式机器学习技术】【①各客户端从服务器下载全局模型;②各客户端训练本地数据得到本地模型;③各客户端上传本地模型到中心服务器;④中心服务器接收各方数据后进行加权聚合操作,得全局模型】

随着计算机算力的提升,机器学习作为海量数据的分析处理技术,已经广泛服务于人类社会。然而,机器学习技术的发展过程中面临两大挑战:- 一是数据安全难以得到保障,隐私数据泄露问题亟待解决;- 二是网络安全隔离和行业隐私,不同行业、部门之间存在数据壁垒,导致数据形成“孤岛”无法安全共享 ,而仅凭各部门独立数据训练的机器学习模型性能无法达到全局最优化。为了解决以上问题,谷歌提出联邦学习(FL,federat

文章图片
Loss/损失函数05:Triplet Loss(三元组损失)详解【拉近类内距离、拉远类间距离】【应用场景:人脸识别、图像检索、行人重识别、签名验证、语音识别】

相似的图像(如同一个人的不同照片)在特征空间中距离很近不相似的图像(如不同人的照片)在特征空间中距离很远传统的分类损失(如交叉熵)需要预先知道所有类别,但在人脸识别中,我们可能会遇到训练时没见过的新人脸。Triplet Loss通过学习一个嵌入空间(Embedding Space),使得相似样本靠近,不相似样本远离,从而解决这个问题。三元组结构目标DapαDanDapαDan损失函数L∥fa−fp

#人工智能
深度学习-神经网络-循环神经网络(一):RNN(Recurrent Neural Network,循环神经网络;1990年)

为什么有了神经网络还需要有循环神经网络?在普通的神经网络中,信息的传递是单向的,这种限制虽然使得网络变得更容易学习,但在一定程度上也减弱了神经网络模型的能力。特别是在很多现实任务中,网络的输出不仅和当前时刻的输入相关,也和其过去一段时间的输出相关。此外,普通网络难以处理时序数据,比如视频、语音、文本等,时序数据的长度一般是不固定的,而前馈神经网络要求输入和输出的维数都是固定的,不能任意改变。因此,

文章图片
#深度学习#神经网络
    共 960 条
  • 1
  • 2
  • 3
  • 96
  • 请选择