训练集验证集测试集

青葱年少 • 2022年3月7日下午2:57 • 技术文章 • 阅读 256

在构建模型时，我们可以理解为有两个部分。以线性回归为例

首先，选择一个合适的多项式

这里的阶数d属于超参数，在神经网络里面它还包括，每层节点数，迭代层数等等，这些参数是无法像普通的权重参数通过数据集直接训练出来的。

二、训练参数
输入训练集数据并训练权重参数

如果我们把所有的数据全都当作训练集去训练模型，则无法测试模型的泛化结果，容易存在过拟合的问题。如果我们把数据划分成训练集（70%）和测试集（30%）；则无法得到判断超参数。还是无法解决过拟合的问题。

因此聪明的前辈把数据分成了三个部分。训练集（60%）验证集（20%）测试集（20%）

第 1 步：我们选择多个可能适合数据的不同模型（具有不同的超参数）。
第二步：使用训练集训练每个模型，得到最小化代价函数的参数。
第三步：用验证集去选择出最合适的模型A。
第四步：用验证集和训练集去优化模型A的参数
Step 5：使用测试集测试模型的泛化结果。

如下所示：