训练集验证集测试集

在构建模型时,我们可以理解为有两个部分。以线性回归为例

首先,选择一个合适的多项式

训练集验证集测试集
这里的阶数d属于超参数,在神经网络里面它还包括,每层节点数,迭代层数等等,这些参数是无法像普通的权重参数通过数据集直接训练出来的。

二、训练参数
输入训练集数据并训练权重参数

如果我们把所有的数据全都当作训练集去训练模型,则无法测试模型的泛化结果,容易存在过拟合的问题。如果我们把数据划分成训练集(70%)和测试集(30%);则无法得到判断超参数。还是无法解决过拟合的问题。

因此聪明的前辈把数据分成了三个部分。训练集 (60%)验证集(20%) 测试集(20%)

第 1 步:我们选择多个可能适合数据的不同模型(具有不同的超参数)。
第二步:使用训练集训练每个模型,得到最小化代价函数的参数。
第三步 : 用验证集去选择出最合适的模型A。
第四步 :用验证集和训练集去优化模型A的参数
Step 5:使用测试集测试模型的泛化结果。

如下所示:

训练集验证集测试集

版权声明:本文为博主小白搞学习原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/tjw191743/article/details/123301323

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2022年3月7日 下午2:50
下一篇 2022年3月7日 下午3:07

相关推荐