直接resize到224×224还是resize到256×256再裁剪224×224?

xiaoxingxing pytorch 222

原文标题Resize to 224×224 directly or resize to 256 ×256 then crop 224×224?

我在训练集中的图像是这样的叶子。在此处输入图像描述

它的大小是 572*108,我的 resnet 网络需要 224×224 图像作为输入。我发现大多数代码都用第二种方式处理图像(调整到 256×256 然后裁剪 224×224)所以我这样做了。作为结果,我的部分叶子被剪掉了,这可能会影响叶子分类的效果。像这样:在此处输入图像描述

第一种方式(直接resize为256×256)可以保持更完整的结构。像这样:在此处输入图片描述

我担心如果选择第一种方式,我会丢失很多训练图像,因为随机裁剪 224×224 可能会生成更多的训练样本。

我应该选择哪个?

原文链接:https://stackoverflow.com//questions/71989157/resize-to-224%c3%97224-directly-or-resize-to-256-%c3%97256-then-crop-224%c3%97224

回复

我来回复
  • chongkai Lu的头像
    chongkai Lu 评论

    运行两个实验并比较它们的评估结果是最简单的解决方案。

    模型对图像进行分类不需要完整的视图,对人类来说也是如此。相反,从裁剪图像中学习通常可以提高模型的泛化能力。

    2年前 0条评论