Sirius.z 个人主页

@2301_80985954

Sirius.z

2024-04-16 11:23:36 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

第J5周：SE注意力机制

环境版本SE注意力机制SE（Squeeze-and-Excitation）可以理解成“给每个通道打分”的模块：重要的通道分数高，不重要的分数低。它先用全局平均池化把每个通道“压缩”成一个数（看这个通道整体有多重要）；再用一个小的全连接网络算出每个通道的权重；最后把权重乘回去，让网络更关注有用通道。改动不大、加的参数也不多，但有机会让模型更聚焦在重要特征上，少被背景噪声带跑。

#python

第T11周：优化器对比实验

实验环境我进行了 Adam (1e-5)、SGD 一致组 (1e-5) 与 SGD 公平组 (1e-4 + Momentum) 三个对照模型。“SGD 一致组”设计SGD (1e-5)这个组，初衷是为了通过绝对控制变量来观察算法的本性。收获：实验结果显示，在与 Adam 完全一致的微小步长下，SGD 的准确率曲线几乎没有进步。这让我直观感受到了非自适应优化器的局限性——它缺乏 Adam 那种自动放

#python

第T9周：猫狗识别2

实验环境针对上周的bug：返回的是当前这个 batch（一小撮图片）的 loss 和 accuracy。一个 epoch 包含 340 个 batches，每个 batch 的表现都忽高忽低。原代码像是在终点线只看最后一名选手的成绩，在循环结束后直接把最后一份数据存入history。由于train_loss在循环中不断被新值“覆盖”，导致最终记录的仅仅是最后一个batch的数值，而非整场比赛的平均

#python

第T8周：猫狗识别

实验环境知道了可以通过与tqdm的配合使用来自定义训练循环。不同于fit()函数，允许我在每一个 Batch 迭代中精准控制梯度更新，并实时获取当前的 Loss 和准确率。配合tqdm进度条，能直观的看到通过实时监控学习率衰减对收敛的影响，从而能即时分析模型训练情况。为了缓解 VGG-16 庞大参数量带来的过拟合问题，我在全连接层中加入了，通过随机失活神经元迫使模型学习更具泛化性的特征，而非死记硬

#python

到底了