ML

Fit Curve Stability

Posted by keming on December 19, 2017

正常的fit曲线

正常情况下，我们在拟合的时候，随着epoch的增加，我们的train acc和val acc会逐渐趋于稳定。
当然，这是在使用一些自适应步长方法的时候，如果只是SGD，可能训练着acc就飘了。

最近训练遇到的

图就是这样

理解

首先要明确的是，train acc的下降并不能说明模型出现了什么问题。这只是训练方法的问题。
可能参数空间在极小点周围并不平滑，有极大值的尖点出现。我们需要设计方法来规避这些极大值。
考虑的方法是保存这样一个较好值，再重新修改lr进行fine tune。

启示

因为这种问题遇见的不多，最开始我怀疑是数据或者模型的问题。
它给我们提了个醒，自适应的优化器并不是尽善尽美的，我们绝不能将其当作黑盒。