logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第T9周:猫狗识别2

实验环境针对上周的bug:返回的是当前这个 batch(一小撮图片)的 loss 和 accuracy。一个 epoch 包含 340 个 batches,每个 batch 的表现都忽高忽低。原代码像是在终点线只看最后一名选手的成绩,在循环结束后直接把最后一份数据存入history。由于train_loss在循环中不断被新值“覆盖”,导致最终记录的仅仅是最后一个batch的数值,而非整场比赛的平均

#python
第T8周:猫狗识别

实验环境知道了可以通过与tqdm的配合使用来自定义训练循环。不同于fit()函数,允许我在每一个 Batch 迭代中精准控制梯度更新,并实时获取当前的 Loss 和准确率。配合tqdm进度条,能直观的看到通过实时监控学习率衰减对收敛的影响,从而能即时分析模型训练情况。为了缓解 VGG-16 庞大参数量带来的过拟合问题,我在全连接层中加入了,通过随机失活神经元迫使模型学习更具泛化性的特征,而非死记硬

#python
到底了