稳健估计方法

众所周知,最小二乘法对于异常值非常敏感,所以在面对污染数据时常常需要稳健方法。Huber提出的M估计是最流行的稳健回归估计量之一。常用的稳健估计方法通常都是针对回归模型,或者说是基于最小二乘方法。对于回归模型

y=x\beta+\epsilon

最小二乘法得到的估计量为

\hat{\beta}=\arg\min_{\beta}\sum_{i=1}^n(y_i-x_i\beta)^2

本文介绍了几种基于回归模型的稳健估计方法。

1.Huber回归估计量为

\hat{\beta}=\arg\min_{\beta}\sum_{i=1}^nl_\tau(e_i)

其中 e_i=y_i-x_i\beta\tau为预先给定的阈值。

l(e_i)=\left\{\begin{matrix} \frac{1}{2}e_i^2 ,& |e_i|\leq\tau,\\ \tau|e_i|-\frac{1}{2}\tau^2,& |e_i|>\tau .\end{matrix}\right.

由上式可以看出,在残差绝对值|e_i|小于阈值\tau

2.自适应HUber回归

Sun et al.(2020)在Adaptive Huber Regression中提出了自适应Huber回归方法。其大体做法和Huber回归相同,只是阈值\tau的选择采用自适应的方法,通过适应样本量、维数和矩在偏差和稳健性之间权衡。该论文的理论框架处理任意(1 + δ)阶矩有界的重尾分布。

3.指数平方损失

Wang et al.(2013)在Robust Variable Selection With Exponential Squared Loss中提出了一类基于指数平方损失的惩罚鲁棒回归估计量。在给定的正则条件下,该论文的估计量是\sqrt{n}一致的,并且具有oracle属性。重要的是,该论文证明了估计量可以达到1/2的最高渐近击穿点,并且它们的影响函数与响应或协变量域的异常值有关。其估计量如下

\hat{\beta}=\arg\min_{\beta}\sum_{i=1}^n\exp\{-(y_i-x_i\beta)^2/\gamma_n\}-n\sum_{j=1}^pp_{\lambda_{nj}}(|\beta_j|)

其中\gamma_n是调整参数,\lambda是惩罚参数。

4.Tukey’s Biweight损失

Chang et al.(2018)在Robust Lasso Regression Using Tukey’s Biweight Criterion中提出了一种自适应lasso的扩展,称为tukey-lasso。通过使用Tukey的双权准则,而不是平方损失,Tukey-lsaao在响应和协变量中都能抵抗异常值。该论文证明了Tukey-lasso也享有oracle属性。其估计量如下

\hat{\beta}=\arg\min_{\beta}2\sum_{i=1}^n\rho_d\left(\frac{y_i-x_i\beta}{\hat{\sigma}}\right )-n\sum_{j=1}^pp_{\lambda_{nj}}(|\beta_j|)

其中\hat{\sigma}为随机误差\epsilon的标准差的稳健估计,

\rho_d(u)=\left\{ \begin{matrix} \frac{d^2}{6}\{1-[1-(\frac{u}{d})^2]^3\},&|u|\leq d,\\ \frac{d^2}{6},&|u|>d. \end{matrix} \right.

其中d是调整常数,类似于Huber损失中的阈值,可以控制稳健性水平。

5.修改的Huber函数

Jiang et al.(2019)在Robust Estimation Using Modified Huber’s Functions With New Tails中通过将Huber函数的尾部替换为指数平方损失来进行稳健估计。在回归框架中,证明了该论文的混合估计量是高效的,达到了50%的最高渐近击穿点。该论文还建立了正则条件下估计量的\sqrt{n}-一致性和渐近正态性。

\hat{\beta}=\arg\min_{\beta}\sum_{i=1}^n\rho_{\tau,\lambda}\left(\frac{y_i-x_i\beta}{S_n}\right )

其中S_n是尺度参数,是基于残差r_i=y_i-x_i\tilde{\beta}_{\text{INI}}的归一化中值绝对偏差(MAD)估计量,例如,S_n=1.4826\times\text{median}_i(|r_i-\text{median}_j(r_j))|)

\rho_{\tau,\lambda}(u)=\left\{\begin{matrix}\frac{1}{2}u^2,&|u|\leq \tau,\\ \frac{\lambda+\tau^2}{2}[1-\frac{\lambda}{\lambda+\tau^2}\exp (-(u^2-\tau^2)/\lambda)],&|u|>\tau. \end{matrix}\right.

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年11月10日
下一篇 2023年11月10日

相关推荐