如何选择在 RandomizedSearchCV 或 GridSearchCV 中使用哪个 Estimator 对象?

原文标题How to choose which Estimator object to use in RandomizedSearchCV or GridSearchCV?

我是 python 和 sklearn 机器学习的新手,所以如果我的问题如此简单和愚蠢,请接受我的歉意。

我正在学习如何使用 RandomizedSearchCV 和 GreadSeachCV,我有一个问题,我应该为 RandomizedSearchCV 或 GreadSeachCV 选择哪些标准?

它必须与我用于模型的相同吗?

例如,这些有什么区别?

rf = RandomForestClassifier()
rf_random = RandomizedSearchCV(estimator = rf, ...)

dt = DecisionTreeClassifier()
dt_random = RandomizedSearchCV(estimator = dt, ...)

以上任何一个比另一个更好吗?它完全正确吗?

问题是我想知道我应该为我正在使用的搜索 cv 选择什么估计器对象?

提前致谢

原文链接:https://stackoverflow.com//questions/71681939/how-to-choose-which-estimator-object-to-use-in-randomizedsearchcv-or-gridsearchc

回复

我来回复
  • eschibli的头像
    eschibli 评论

    estimator您在构造参数搜索对象时提供的是您想要优化超参数的分类器。所以在你的情况下,rf_random将优化随机森林分类器的参数,dt_random将优化决策树分类器的参数,当然在你提供的参数分布内。

    然后,您可以提取最优参数并构建一个新的分类器,或者使用 CV 对象直接通过底层估计器进行预测。

    2年前 0条评论