站点图标 AI技术聚合

实用机器学习笔记第 4 章 – 模型评估和验证

实用机器学习笔记第 4 章 - 模型评估和验证

1. 模型评估

本章主要讲如何测量一个模型,当模型已经训练好时

1. 模型指标

1.1 举例广告投放

1.2 常见分类问题的指标

1.2.1 准确度Accuracy = 正确预测样本大小/样本大小

1.2.2 精度Precision = 预测正确为类i的个数/我预测成类i的样本的个数

1.2.3 召回率Recall = 预测正确为类i的样本个数/类i的样本个数

1.2.4 F1:做调和平均 2pr/(p+r)

1.3 AUC & ROC

1.3.1 AUC好坏(AUC 0.5是最糟糕,1是最高,我们需要把AUC从0.5优化到1)

1.4 商业指标,以广告投放为例(提高收入、增加用户体验)

2. 过拟合和欠拟合

2.1 训练和泛化误差

2.1.1 训练误差:在训练数据上看到的模型误差
2.1.2 泛化误差:在新的数据上的模型误差

2.2 数据和模型的复杂度

2.2.1 模型复杂度:能够去拟合各种各样的函数的能力

2.2.2 模型复杂度的影响

2.2.3 数据复杂度:信息量的多少

2.3 模型复杂度 vs 数据复杂度

3. 模型验证

3.1 估计泛化误差

3.2 生成验证数据集

3.2.1 把样本数据随机的分成训练和验证集(验证集误差近似作为泛化误差)

3.2.2 随机的选取%n样本作为验证集(n=50,40,30,20,10)

3.2.3 不是独立同分布的数据拆分(训练集和验证集)

3.2.4 K折交叉验证(数据不够多的时候)

3.3 常见错误

3.3.1 验证集有来自于训练集的样本

3.3.2 信息泄漏

文章出处登录后可见!

已经登录?立即刷新
退出移动版