
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了序列数据的特点及其处理方法。首先解释了序列数据(如股票价格、语音信号、文本等)与普通表格数据的区别,强调顺序对序列数据的重要性。然后讲解了自回归模型的概念,即用历史数据预测未来值。重点阐述了文本数据的预处理流程:词元化(按词或字符切分)、建立词表(将token转为数字编号)、序列切分(将长文本切为训练片段)。文章还比较了随机采样和顺序分区两种训练策略的优缺点,为后续RNN模型的学习奠定了

本文深入解析了两种突破性的CNN架构:NiN和GoogLeNet。NiN通过1x1卷积和全局平均汇聚,有效解决了传统CNN中全连接层参数量过大的问题,实现了轻量化设计。GoogLeNet则创新性地提出Inception块,并行使用不同尺度的卷积核(1x1、3x3、5x5)和最大汇聚,让网络自动学习多尺度特征组合。这两种架构都大量运用1x1卷积进行通道融合与维度调整,其中NiN块通过"卷积+1x1卷

本文系统介绍了深度学习中的核心组件与工具,包括层、块、参数管理和GPU加速。主要内容包括:1)层与块的概念,如何自定义块和嵌套块;2)参数访问、初始化和绑定方法;3)延后初始化的优势;4)自定义层的实现;5)模型参数的保存与加载;6)GPU加速的使用技巧。文章采用电脑硬件组装的比喻,帮助读者理解深度学习模型的构建过程,从基础使用进阶到高级定制,为后续学习更复杂的神经网络模型奠定基础。

本文介绍了多层感知机(MLP)的基本原理和实现方法。MLP通过添加隐藏层和激活函数,解决了单层神经网络无法处理非线性关系的局限性。文章详细讲解了ReLU等激活函数的作用,并对比了从零实现和PyTorch简洁实现两种方式。针对过拟合问题,重点介绍了权重衰减和Dropout两种正则化技术。最后通过Kaggle房价预测项目,展示了完整的MLP应用流程,包括数据预处理、模型训练和评估等环节。文章还讨论了梯

本文介绍了深度学习中最基础的线性神经网络模型,包括线性回归和softmax回归。线性回归用于预测连续值(如房价),通过最小化平方损失函数来优化模型参数;softmax回归用于分类问题(如图像识别),通过交叉熵损失函数将输出转化为概率分布。文章详细讲解了从零实现和框架简洁实现两种方式,并强调了矢量化计算的重要性。此外,还介绍了Fashion-MNIST数据集的应用,以及softmax运算中的数值稳定








