坐吃山猪个人主页

@2301_77717148

坐吃山猪

2024-03-07 17:24:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习10-解读CNN代码Pytorch版

Transformer模型中的自注意力机制通过三个权重矩阵（W_Q、W_K、W_V）生成Query、Key和Value向量，分别用于查询、标记和存储信息。Query关注当前词的需求，Key提供其他词的特征，Value包含其他词的实际内容。这些矩阵通过初始化（如Xavier或Kaiming）和训练过程中的反向传播进行优化。Transformer的编码器和解码器分别负责特征提取和序列生成，编码器通过多

#学习 #python #transformer

共 119 条

请选择