
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文深入解析了Transformer模型中的两种关键掩码机制。填充掩码(Padding Mask)用于处理不定长序列中的填充噪声,通过屏蔽无效位置确保注意力机制聚焦于实际内容。未来信息掩码(Subsequent Mask)则解决解码器训练时的"信息泄露"问题,采用上三角矩阵形式强制模型在预测时只能关注历史信息。文章详细阐述了两种掩码的数学原理和代码实现,特别解释了未来信息掩码通
本文介绍了如何从0开始构建 LeNet5 去识别手写数字(在MNIST数据集上)。代码包括三大部分:网络结构部分、训练部分、测试部分。在编LeNet5部分代码之前,本文详细地梳理了LeNet5的结构,对于初学者十分友好。训练和测试部分也都有详细的代码说明。在实现 LeNet5 手写数字识别的同时,补充了很多CNN的基础概念和Python编程知识。包括:PyTorch中的常用库和其中的模块、特征图在

在Windows系统中,这是因为triton只支持Linux系统。需要安装triton for windows

本文在AutoDL提供的JupyterLab中配置了深度学习环境。手把手教学!首先创建了base环境,然后创建了自己的环境(命名为x9py38),并在x9py38环境中安装了一些深度学习包,具体包括PyTorch、jupyter d2l和ipykernel。

本文首先在D盘创建了虚拟环境,然后在虚拟环境中安装了PyTorch,最后配置了pycharm的解释器。

本文在AutoDL提供的JupyterLab中配置了深度学习环境。手把手教学!首先创建了base环境,然后创建了自己的环境(命名为x9py38),并在x9py38环境中安装了一些深度学习包,具体包括PyTorch、jupyter d2l和ipykernel。









