机器学习 – 提升树

心中带点小风骚 • 2022年4月2日下午3:01 • 技术文章 • 阅读 214

内容

1. 什么是升降树

2. 提升树模型

3. 提升树算法

3.1 分类提升树

3.2回归提升树

四、提升树示例

以上均参考李航老师的《统计学习法》。如果博客有不足之处，请指教！！！

1. 什么是升降树

提升树（BT,Boosting Tree）是以分类树和回归树为基本分类器的提升方法。提升树被认为是统计学习中性能最好的方法之一。

使用决策树作为基函数的提升方法称为提升树。

2. 提升树模型

Boosting 方法采用了一个加法模型（即，基函数的线性组合）和一个向前逐步的方法。

分类问题的决策树是二分类树，回归问题的决策树是二元回归树。

提升树模型可以表示为决策树的加法模型：

那么具体是怎么计算的呢？

首先，提升树算法采用前向分步算法，确定出是提升树f0(x)=0,第m步的模型是：

分类提升树可看作AdaBoost算法的特殊情况，后续将在AdaBoost中详细介绍。

已知一个训练数据集T={（Xi,Yi),i=1,2,3…..n}，X为输入，Y为输出。如果将X划分为J个互不相交的区域R1,R2,R3,…Rj，并且在每个区域上确定输出的常量Cj，那么树可表示为：

提升树利用加法模型与前向分步算法实现的优化过程。当损失函数是平方损失和指数损失函数时，每一步优化是很简单的。但对一般损失函数而言，每一步优化并不容易，Freidman提出了梯度提升算法。

在当前模型的值上利用损失函数的负梯度

拟合回归树作为回归问题增强树算法残差的近似值。

文章出处登录后可见！

已经登录？立即刷新