目标检测任务的地位
目标检测与分类、分割并称为CV的三大主要任务。目标检测可以看出是分类与分割任务的一座过度桥。
定义
前面我们讲了目标检测的许多应用,那到底什么是目标检测呢?或者说目标检测的任务是什么?目标检测实际上就是找出图像中所有感兴趣的目标(object),并获得这一目标的类别信息和位置信息。
核心问题
目标检测所面临的核心问题可以概括为3个:
- 大小的多样性
同一张图像上可能同时出现多个不同或相同的目标,他们之间的大小差异大 - 位置的任意性
目标可以出现在图像的任意位置 - 形态的差异性
同一物体目标的形态差异可能很大,目标可能有各种不同的形状
理想检测器
那么对于一个理想的目标检测器,我们希望它能够在解决上述核心问题的前提下,具有高的准确度及效率。
关键挑战
从精度角度看挑战
从高准确度的角度来看,理想的目标检测器应该具有高的定位及识别精度。在显示现实的场景中常见的挑战主要有:
- 类内的差异性
类内自身材料、纹理、姿态等带来的多样性干扰,如黄色框图中椅子的制作材料及形态差异很大,但是它们都属于椅子的大类别 - 外部环境的干扰
外部环境带来的噪声干扰,比如蓝色框中光照、迷雾、遮挡等带来的识别及回归挑战。
- 类间的相似性
类间因纹理、姿态所带来的相似性干扰,比如黄色框图中是不同品种的动物,但是它们之间的差异又很小;这里实际上可以衍生为细粒度识别领域 - 集群小目标问题
集群目标检测所面临的数量多,类别多样化的问题,比如行人检测,遥感检测等。
从效率角度看挑战
目标检测是一个非常接地气的应用技术,因此,除了考虑高准确度还需要考虑处理时间,占用内存,消耗流量等方面的效率问题。因为在现实场景中,目标检测可能需要识别的物体种类及数量成千上万。
现实中常见的场景有小目标检测场景。我们认为小目标检测场景就很好的包含了上述所提及的所有可能的问题与挑战。对于低像素问题,多数研究采用图像重构方法来解决,对于易遮挡问题,大多研究通过上下文语义信息来辅助检测,对于小尺寸问题则通过尺度自适应变换来解决,对于大批量数据问题可通过降低参数来实现。
文章出处登录后可见!
已经登录?立即刷新