
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
第J5周:SE注意力机制
环境版本SE注意力机制SE(Squeeze-and-Excitation) 可以理解成“给每个通道打分”的模块:重要的通道分数高,不重要的分数低。它先用全局平均池化把每个通道“压缩”成一个数(看这个通道整体有多重要);再用一个小的全连接网络算出每个通道的权重;最后把权重乘回去,让网络更关注有用通道。改动不大、加的参数也不多,但有机会让模型更聚焦在重要特征上,少被背景噪声带跑。
第T11周:优化器对比实验
实验环境我进行了 Adam (1e-5)、SGD 一致组 (1e-5) 与 SGD 公平组 (1e-4 + Momentum) 三个对照模型。“SGD 一致组”设计SGD (1e-5)这个组,初衷是为了通过绝对控制变量来观察算法的本性。收获:实验结果显示,在与 Adam 完全一致的微小步长下,SGD 的准确率曲线几乎没有进步。这让我直观感受到了非自适应优化器的局限性——它缺乏 Adam 那种自动放
第T9周:猫狗识别2
实验环境针对上周的bug:返回的是当前这个 batch(一小撮图片)的 loss 和 accuracy。一个 epoch 包含 340 个 batches,每个 batch 的表现都忽高忽低。原代码像是在终点线只看最后一名选手的成绩,在循环结束后直接把最后一份数据存入history。由于train_loss在循环中不断被新值“覆盖”,导致最终记录的仅仅是最后一个batch的数值,而非整场比赛的平均
到底了







