MeanShift、K-Means与GMM迭代

MeanShift聚类

又称均值漂移算法,首先需要一个迭代半径r,相似阈值T

对每个数据,作为一个新类,从其位置半径r内,选择满足相似条件的数据,放到一个表中。

计算表内数据的位置均值,数据均值,将新的位置和均值作为该类的特征,重新计算满足相似条件的数据,不断迭代直到收敛。

相当于数据有两个相似条件,一个位置相似条件r,一个数据相似条件T

K-Means聚类

该方法被称为k均值,首先需要选定k个聚类中心。

对每个数据,计算出最近的聚类中心C,将其放入C类的数据列表中

拿到每个聚类中心列表中的数据,求取数据均值,将该值作为新的数据中心。不断迭代直到中心不再变化

若将数据分为位置数据特征值,它和meanshift就很像了。

不过区别在于k-means中,类的数量是手动确定的,而mean shift的类数量是迭代自动确定的,并且最坏情况可能是每个数据都是一个类。

GMM聚类

原理


首先,假设数据中有k个高斯分布,数据的实际分布可用其线性组合描述:
MeanShift、K-Means与GMM迭代

其中MeanShift、K-Means与GMM迭代称为混合模型中的第k个分量。MeanShift、K-Means与GMM迭代 是混合系数(或者叫权重、选中该分量的概率),且满足:

  1. MeanShift、K-Means与GMM迭代
  2. MeanShift、K-Means与GMM迭代

如果要从 GMM 的分布中随机地取一个点的话,实际上可以分为两步:

  1. 首先随机地在这 K 个分量之中选一个,每个分量被选中的概率实际上就是它的系数MeanShift、K-Means与GMM迭代

  2. 选中之后,再单独地考虑从这个分量的高斯分布中选取一个点就可以了。

EM参数估计

对于GMM中的每个分量,有三个参数:选中概率MeanShift、K-Means与GMM迭代,分布均值MeanShift、K-Means与GMM迭代,分布标准差MeanShift、K-Means与GMM迭代。如果我们从分布选取一个点,怎么知道这个点是来自哪个分量呢?或者说如何确定MeanShift、K-Means与GMM迭代?EM算法就可以解决GMM参数估计的问题。

通过EM算法,我们可以迭代计算出GMM中的参数:MeanShift、K-Means与GMM迭代

首先我们可以引入一个新的随机变量MeanShift、K-Means与GMM迭代

MeanShift、K-Means与GMM迭代,表示第k个分量被选中的概率,由于是每次只能有一个分量被选中,即:

  1. MeanShift、K-Means与GMM迭代
  2. MeanShift、K-Means与GMM迭代
  3. MeanShift、K-Means与GMM迭代
  4. MeanShift、K-Means与GMM迭代

根据贝叶斯定理,MeanShift、K-Means与GMM迭代是先验概率,MeanShift、K-Means与GMM迭代是似然概率,MeanShift、K-Means与GMM迭代是后验概率。设MeanShift、K-Means与GMM迭代,我们有

  1. MeanShift、K-Means与GMM迭代
  2. MeanShift、K-Means与GMM迭代

EM算法

  1. 定义分量数目MeanShift、K-Means与GMM迭代,对每个分量设置MeanShift、K-Means与GMM迭代MeanShift、K-Means与GMM迭代MeanShift、K-Means与GMM迭代 的初始值,然后计算对数似然函数。

MeanShift、K-Means与GMM迭代

  1. E 阶段: 根据当前的MeanShift、K-Means与GMM迭代MeanShift、K-Means与GMM迭代MeanShift、K-Means与GMM迭代 计算后验概率MeanShift、K-Means与GMM迭代

MeanShift、K-Means与GMM迭代

  1. M阶段:根据E阶段中计算的MeanShift、K-Means与GMM迭代再计算新的MeanShift、K-Means与GMM迭代MeanShift、K-Means与GMM迭代MeanShift、K-Means与GMM迭代

MeanShift、K-Means与GMM迭代 ,则:

  1. MeanShift、K-Means与GMM迭代
  2. MeanShift、K-Means与GMM迭代
  3. MeanShift、K-Means与GMM迭代
  1. 重新计算步骤1中的对数似然函数

  2. 检查参数是否收敛或对数似然函数是否收敛,若不收敛,则返回第2步。

其他参考

EM算法
详解EM算法与混合高斯模型
高斯混合模型(GMM)及其EM算法的理解
更多聚类算法参考我另一篇博客:无监督算法

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2022年5月12日
下一篇 2022年5月12日

相关推荐

此站出售,如需请站内私信或者邮箱!