机器学习 06：SMO 算法

社会演员多 • 2022年5月28日下午3:28 • 技术文章 • 阅读 388

目录

概述

机器学习 06：SMO 算法是由在 1998 年提出的、针对软间隔最大化对偶问题求解的一个算法，其基本思想很简单：如果所有变量的解都满足此优化问题的 KKT 条件，则这个优化问题的解就得到了；否则在每一步优化中，挑选出诸多参数机器学习 06：SMO 算法中的两个参数作为变量，其余参数都视为常数，问题就变成了类似于二次方程求最大值的问题，从而我们就能求出解析解，这两个变量中，一个是违反 KKT 条件最严重的那一个，另一个由约束条件自动确定一个。

选择变量的启发式方法

先来回顾一下机器学习 06：SMO 算法中的优化目标函数：

机器学习 06：SMO 算法

由于要满足约束机器学习 06：SMO 算法，所以每次需要选取两个做为变量，这一点与坐标上升法不同。

要使优化目标函数有解，我们需要使其满足机器学习 06：SMO 算法条件中的互补松弛：

机器学习 06：SMO 算法

根据上面的条件我们可以得出：

机器学习 06：SMO 算法

由于机器学习 06：SMO 算法，我们令

机器学习 06：SMO 算法

则可以推出以下三个条件：

机器学习 06：SMO 算法

选择第一个变量

在机器学习 06：SMO 算法中，我们称第一个变量为外循环。外循环取的是样本中违反条件最严重的点。

我们可以借助上面推出的条件来度量一个点违反机器学习 06：SMO 算法条件的程度，具体来说，我们定义三份“差异向量”

机器学习 06：SMO 算法

其中第机器学习 06：SMO 算法个向量对应着第个条件。对于不同的条件，我们按不同方式将对应向量的某些位置置为 0。

第一个条件：若满足：
- 且
- 且
第二个条件：若满足：
- 或且
- 且
第三个条件：
- 且
- 且

最后只需要将这三个差异向量的平方相加作为“损失”，从而直接选出损失最大的机器学习 06：SMO 算法作为外循环即可。

选择第二个变量

第二个变量成为内循环，只需要简单的随机选取一个即可。

取出这两个变量之后，把其它变量看做常数，这样优化目标函数就变成了带约束的二次规划问题。

目标函数的优化

假设选择的两个变量是机器学习 06：SMO 算法，把其它的都看作常数。定义那么原先的优化目标函数就成了：

无约束求极值

我们先暂时不管约束条件机器学习 06：SMO 算法，通过可以将目标函数替换成单变量形式：

我们设更新前的值为机器学习 06：SMO 算法 , 更新后的值为，对目标函数进行一个偏导的求：

因为 SVM 中数据点的预测值为：机器学习 06：SMO 算法因此有：

另有：机器学习 06：SMO 算法

将上面三个式子带入偏导中并化简得：
机器学习 06：SMO 算法

设机器学习 06：SMO 算法，则有：

这样我们就求出了这两个变量在无约束情况下的解析解。

加入约束

当机器学习 06：SMO 算法时，线性限制条件可以写成：，根据的正负可以得到不同的上下界，可以统一表示为：

下界：
上界：

当机器学习 06：SMO 算法时，限制条件可以写成：，此时上下界可以统一为：

下界：
上界：

由此可知，此约束为方形约束，下图为它的限制区域。
机器学习 06：SMO 算法

根据得到的上下界，我们可知加入约束后的机器学习 06：SMO 算法为：

这样就实现了对机器学习 06：SMO 算法的更新。

更新阈值 b

每次更新完一对机器学习 06：SMO 算法之后都需要重新计算阈值，因为它关系到的计算和优化时误差的计算。

当机器学习 06：SMO 算法，根据条件可知相应的数据点为支持向量，满足，两边同时乘得：，因此的值为：

其中，机器学习 06：SMO 算法

当机器学习 06：SMO 算法时：

当机器学习 06：SMO 算法都有效时他们是相等的，即
当都在边界上，且时，选择它们的中点作为新的阈值：

同步更新于：SP-FA 的博客

文章出处登录后可见！

已经登录？立即刷新

支持向量机机器学习算法

赞 (0)

社会演员多普通用户

0

基于 Java 机器学习自学笔记（第71-73天：BP神经网络）

上一篇 2022年5月28日下午3:27

GAN的训练技巧：炼丹师养成计划 ——生成式对抗网络训练、调参和改进

下一篇 2022年5月28日