logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PyTorch 自定义 Dataset 与 DataLoader 详解:从 TXT 标注文件读取图像分类数据

在 PyTorch 入门阶段,我们经常使用自带的 torchvision.datasets.ImageFolder 来加载数据。数据必须按类别分好子文件夹存放。但在实际的工程项目或开源数据集中(如图像分类、目标检测等),数据往往是**“大杂烩”**形式的:几千上万张图片全部混放在一个大文件夹中,另附一个标注文件(如 train.txt 或 val.json)。面对这种“一图一表”的结构,Image

文章图片
#pytorch#分类#人工智能
卷积网络参数分析与优化:从维度陷阱到训练细节

在掌握了卷积神经网络(CNN)的基本原理后,真正上手写代码时,最困扰我们的往往不是“卷积是什么”,而是“维度怎么对不上”。如何精准控制卷积维度,以及在PyTorch 工程实战中,那些让模型准确率从 97% 飞跃到 99% 的优化细节。输入输出对齐:通过调节 Padding,让卷积专注于提取特征,而不是改变尺寸。逐步下采样:利用池化层(Pooling)将尺寸减半(如 28→14→7),同时通道数翻倍

文章图片
#深度学习#人工智能
神经网络基础:从 RNN 的局限到 Transformer 的巅峰

在和中,我们掌握了全连接网络和卷积网络(CNN)。全连接层擅长处理静态特征,卷积层擅长处理空间特征(图像)。然而,当面对(如一句话、一段音频)时,数据之间的变得至关重要。今天我们通过对比传统 RNN 结构,深度拆解目前 AI 界的统治级架构——。

文章图片
#神经网络#rnn#transformer
到底了