过拟合与欠拟合

什么是过拟合和欠拟合

欠拟合:算法不太符合样本的数据特征
过拟合:算法太符合样本的数据特征,对实际生产中的数据特征却无法拟合

过拟合(overfitting)具体现象体现为,随着训练过程的进行,模型复杂度增加,在训练集上的错误率渐渐减小,但是在验证集上的错误率却渐渐增大。

特征过多,特征数量级过大,训练数据过少,都可能导致过度拟合。过拟合会让模型泛化能力变差。