如何在训练隔离森林模型时知道哪些特征导致异常[关闭]

原文标题How to know which features causes anomalies while training isolation forest model [closed]

我正在用一个包含 10 个特征的数据框训练一个不受干扰的隔离森林模型,该模型表现良好并检测异常。我的问题是如果异常被捕获,我想知道哪些特征导致了该异常。有没有怎么做?如果没有,是否有其他模型可以让我这样做

原文链接:https://stackoverflow.com//questions/71674209/how-to-know-which-features-causes-anomalies-while-training-isolation-forest-mode

回复

我来回复
  • Jon Nordby的头像
    Jon Nordby 评论

    SHAP 值和shap 库可用于此目的。有关示例,请参见此答案。

    从数据点的解释器中获取形状值后,您可以使用瀑布图查看不同特征对决策的影响。

    shap.plots.waterfall(shap_values[0])
    

    它会给出一个类似这样的情节:

    enter image description here

    2年前 0条评论