木子十口儿几丶个人主页

@weixin_50752408

木子十口儿几丶

2023-07-24 16:44:17 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

pytorch训练模型保存与加载

是将PyTorch模型的状态字典（state dictionary）保存到文件中的常用代码。返回一个Python字典，该字典包含了模型所有可学习参数的名称和对应的张量值。方法将这些参数加载到新的模型实例中，从而创建一个与原模型参数相同的新模型。函数会返回一个Python字典，该字典包含了被保存的模型参数。是将训练好的模型参数加载到新模型中的常用代码。中，以便在需要时重新加载模型参数。函数将这个字典

#pytorch #深度学习 #人工智能

pytorch训练模型保存与加载

#pytorch #深度学习 #人工智能

损失函数——对数损失（Logarithmic Loss，Log Loss）

要在训练中使用对数损失作为损失函数，可以在模型训练的过程中调用 PyTorch 中的损失函数计算方法，并将计算得到的损失加入到反向传播过程中以更新模型参数。在 PyTorch 中，可以使用 nn.BCELoss() 来计算二元分类问题的对数损失，使用 nn.CrossEntropyLoss() 来计算多元分类问题的对数损失。可以看出，当预测的概率接近于实际标签时，对数损失接近于0，而当预测的概率偏

#深度学习 #机器学习 #人工智能

损失函数——KL散度（Kullback-Leibler Divergence，KL Divergence）

KL散度衡量的是在一个概率分布 �P 中获取信息所需的额外位数相对于使用一个更好的分布 �Q 所需的额外位数的期望值。要在训练中使用 KL散度作为损失函数，可以将其作为模型的一部分加入到损失函数的计算中。在机器学习中，KL散度常常用于衡量两个概率分布之间的差异程度，例如在生成模型中使用 KL散度作为损失函数的一部分，或者在聚类和分类问题中使用 KL散度作为相似度度量。需要注意的是，KL散度的计算要

#人工智能 #机器学习 #算法

损失函数——交叉熵损失（Cross-entropy loss）

对于每个类别i，yi表示真实标签x属于第i个类别的概率，y^i表示模型预测x属于第i个类别的概率。对于每个输入数据x，我们定义一个C维的向量y^，其中y^i表示x属于第i个类别的概率。假设真实标签y是一个C维的向量，其中只有一个元素为1，其余元素为0，表示x属于第k个类别。该函数将输入数据视为模型输出的概率分布，将目标标签视为类别索引，并计算这些概率与实际标签之间的交叉熵损失。其中，x

#机器学习 #深度学习 #人工智能

注意力机制——Multi-Head Attention（MHA）

对于一个给定的查询向量，MHA 会对键向量进行加权求和，权重由查询向量和键向量之间的相似度计算得到，然后将得到的加权和乘以值向量进行输出。在多头机制下，输入的序列数据会被分成多个头，每个头进行独立的计算，得到不同的输出。其中 Q, K, V 分别表示查询向量、键向量和值向量，ℎ 表示头的数量，headi 表示第 i 个头的输出，WO 是输出变换矩阵。其中 dk 是键向量的维度，softmax相

#深度学习 #神经网络 #自然语言处理

损失函数——KL散度（Kullback-Leibler Divergence，KL Divergence）

#人工智能 #机器学习 #算法

损失函数——KL散度（Kullback-Leibler Divergence，KL Divergence）

#人工智能 #机器学习 #算法

注意力机制——Multi-Head Attention（MHA）

#深度学习 #神经网络 #自然语言处理

损失函数——交叉熵损失（Cross-entropy loss）

#机器学习 #深度学习 #人工智能

到底了