没有一些变量的预测[关闭]
machine-learning 192
原文标题 :Prediction without some variables [closed]
想象一下,我已经建立了一个用于房价预测的 AI 模型,使用 3 个变量进行训练:size、n_rooms、n_bathrooms。我使用来自我所在地区的庞大数据集对其进行了训练,现在我只想将其应用于另一个地区的房屋。
问题是我不知道其他地区的任何房屋的大小。在不使用“大小”变量的情况下,我怎样才能以最好的方式使用模型?我只是用以前房屋的平均大小填充一个人工列“大小”吗?我可以在模型训练后从模型中删除变量吗?我是否必须再次训练它,从原始数据集中删除“大小”列,然后在新数据集中使用它?
回复
我来回复-
Sadra Naddaf 评论
你的问题太笼统了,所以我笼统地回答:
机器学习只是测试和测试,没有人可以给你一个明确的答案。但,
如果尺寸与价格有很高的相关性,那么减小尺寸并重新训练没有尺寸的模型将在其他领域起作用,但您的模型性能会下降。您不能训练具有 3 个参数的模型,然后尝试将其与 2 个参数一起使用并期望类似的行为。
一种方法是使用具有 3 个参数的新区域没有大小的训练模型是估计新区域的大小:您可以创建一个小模型(线性/回归),接收
n_rooms
、n_bathrooms
和输出size
,然后使用它模型生成size
为新区域,最后你将有新区域的3个参数,并且可以使用新区域的3参数模型。2年前