网站首页设计效果图,上海优化网站 优帮云,wordpress安卓下载失败,网站优化收费一、查看训练日志 训练日志是机器学习中广泛使用的训练诊断工具#xff0c;每个 epoch 或 iterator 结束后#xff0c;在训练集和验证集上评估模型#xff0c;并以折线图的形式显示模型性能和收敛状况。训练期间查看模型的训练日志可用于判断模型训练时的问题#xff0c;例…一、查看训练日志 训练日志是机器学习中广泛使用的训练诊断工具每个 epoch 或 iterator 结束后在训练集和验证集上评估模型并以折线图的形式显示模型性能和收敛状况。训练期间查看模型的训练日志可用于判断模型训练时的问题例如欠拟合或过拟合以及训练和验证数据集是否合适等问题为后续模型调优的参数设置提供了基础。 SuperMap 使用 tensorboard 记录训练时的日志如需查看训练日志可在系统命令行窗口输入 tensorboard --logdir{日志路径}
如
tensorboard --logdir/home/city_grid/log/2020-12-04/image_classification执行后浏览器中访问 http://localhost:6006/效果如图所示 【注】使用 tensorboard 之前要保证命令行环境中 SuperMap iObjects Python Envconda可用需配置 conda 到环境变量中如windows E:\ProgramData\conda
E:\ProgramData\conda\Scripts
E:\ProgramData\conda\Library\bin
【注】需更改为本机路径二、根据训练日志和指标得到较优模型 训练日志中的 y 轴经常为不同的评估指标用以表示模型的性能常用的有 loss、 Accuracy、IoU和mAP等。IoU是二元分类、地物分类等问题常用的评价指标而mAP常用于评估目标检测模型的效果。在实际应用中我们通常结合多种评估指标来综合评价模型的性能。 模型性能评估可以在训练数据集上进行以了解模型的“学习”情况也可以在验证集上进行以了解模型的“泛化”能力。因此我们需要同时关注模型在训练集和验证集上的表现。 2.1 欠拟合 欠拟合表明模型没有充分学习训练数据集的特征表明训练过程过早停止且该模型如进一步训练其性能可得到提升。在训练日志上以 loss 为例欠拟合一般有两种典型表现。它可能会显示一条趋于水平或维持相对较高 loss 值的水平曲线如下图所示表明模型无法学习训练集中足够的信息。这个时候可以考虑增加模型的复杂程度通过增加隐藏层的数量来提升模型的学习能力 欠拟合状况也可通过训练结束时 loss 仍持续减少来识别。从下图可以看出在训练结束时epoch9模型在测试集上的 loss 持续下降并仍有下降的余地而模型在验证集上的 loss 仍有较大波动说明模型没有收敛。这时可增大 epoch 数量直到模型性能不再提升可添加早停策略如果需要很长时间才能达到验证集曲线上的最小值可适当提高学习率加快梯度下降速度。 2.2 过拟合 过拟合是指模型对训练数据集学习得“过”好甚至学习到了训练集中的噪声或随机的错误信息。过拟合的问题在于模型对训练集上有较好的效果但对新数据的泛化能力较差。这种泛化误差的增加可以通过模型在验证集上的性能来衡量。以 IoU 为例过拟合情况在训练日志上可表示为训练集上 IoU 随着经验的增加而继续增加同时验证集的 IoU 上升到一个点并开始再次降低这个拐点可能是训练停止的点因为该点之后的模型为过拟合状态。如下图所示可以看到在训练集上模型性能逐步上升而在验证集上模型的精度在 30 个 epoch 之后就开始下降模型开始出现过拟合。 如果过早过拟合并具有尖锐倒“U”形除数据自身问题外还可能是由于学习率过大可根据模型学习的速度适当调小学习率并观察验证集上的拐点找到合适的 epoch大小。 2.3 模型收敛 模型收敛是训练的目标以 loss 作为评价指标为例模型收敛的训练日志情况应该是训练集上 loss 下降到稳定点验证集上 loss 下降到稳定点且两者的泛化差距很小在理想情况下几乎为零。泛化差距是指模型在训练集和验证集上表现的差距是由于训练集和验证集的数据差异导致的。如下图所示可以看到模型在训练集和验证集上的 loss 趋于稳定且波动较小并且两者差异不大模型达到收敛状态。 2.4 数据集的选择 训练日志还可用于诊断数据集选择是否合适是否具有代表性。不具有代表性的数据集是指该数据集无法概括样本中所有的特征信息。在训练和验证数据集之间如果数据集中的样本数量相对于另一个数据集太少就会发生这种情况。假设某项目需要同时识别影像中山地中稀疏的平房和市中心密集分布的高楼如果训练集只包含了密集房屋的标签就会使训练数据的信息不够全面训练出的模型可能会对稀疏房屋没有很好的预测效果。这种情况可扩增对应数据集的样本扩充时要尽量保证验证集和测试集的样本类别分布相似且较为均衡以达到更好的训练效果。 数据集选择不佳在日志上可能表现为训练集的 loss 下降的很好而验证集上的 loss波动较大且没有改进如下图所示。另一种表现形式可参考模型欠拟合的第一种情况可能是由于训练数据正负样本之间区别不够明显或正样本特征不够突出造成的