什么是评分,机器学习中的实时评分和批量评分有什么区别?

原文标题What is scoring and what’s the difference between real time scoring and batch scoring in machine learning?

我已经看到了用于信用卡欺诈检测的实时评分示例,但我没有看到评分如何实现这样的任务。我认为我从根本上误解了得分。

我的理解是:“给模型打分”(在分类模型的情况下)意味着对一系列数据集(我们知道答案)进行预测,并通过计算模型所做的所有错误预测来评估它所做的预测。正确。即。如果一个模型在 100 个预测中犯了 50 个错误,则该模型的准确率为 50%——因此得分。

但我不明白如何实时检测欺诈行为。如果我们不知道交易是否是欺诈(因为它不是历史数据),那么评分如何实现欺诈检测?

ORI评分实际上是预测的“信心”吗? ie。当我对一个看不见的数据集进行预测时,一个分类模型会告诉我预测的置信度可以是 80%(模型有 80% 的把握它有正确的预测)。在这种情况下得分是 80% ?

我还看到将评分定义为将模型应用于新数据集。这不和预测一样吗?

原文链接:https://stackoverflow.com//questions/71521984/what-is-scoring-and-whats-the-difference-between-real-time-scoring-and-batch-sc

回复

我来回复
  • Nandesh的头像
    Nandesh 评论

    首先,评分取决于您自己定义的指标,以衡量模型的性能。它可以是任何东西,例如置信度、准确性或模型评估的任何其他指标。您必须自己定义要使用的指标以及效果最好的指标,其输出将称为分数。

    实时评分和批量评分的区别:

    假设您正在构建欺诈检测模型。您必须为每笔交易分配分数。有两种方法可以做到这一点。

    实时评分-您实时获取特征并进行所有预处理并将其传递给模型以获得预测。这一切都应该实时发生,并立即产生结果。优点是用户或系统无需等待即可获得结果。

    批量评分 – 当您创建一个定期批量进行预测的模型时,它被称为批量推理或批量评分。想象一下,您每小时或每个午夜运行您的系统进行预测,然后它分批进行。

    它们都有其优点和缺点,但通常,这些决策取决于业务利益相关者和业务需求。

    2年前 0条评论