购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.1 小目标特征淹没

复杂场景下小目标检测具有强烈的应用需求,如大场景的视频监控系统、对地观测卫星、医学图像处理等。近年来,人们已经提出了很多高效的目标检测模型 [24,46-53] ,已有方法在理想场景下已经取得了飞速发展,但这类场景往往背景单一,感兴趣的目标尺寸较大;而复杂场景中的小脸检测尚不能令人满意,DLGC小脸检测结果和HR [24] 小脸检测结果如图3.1所示。遥感图像的目标检测仍然是一个未解决的问题 [43,54-57] ,主要原因在于环境的复杂性导致背景区域和前景目标的分离;再加上小目标本身的信息量匮乏,仅能根据边界框内包含的信息来检测,会导致检测准确率非常低。本章专注于复杂场景下对小目标的检测,目的是估计自然场景和遥感图像目标的位置和尺寸。

图3.1 DLGC小脸检测结果和HR [24] 小脸检测结果

最近,CNNs在物体检测方面产生了革命性的推动力 [58,59] ,基于CNNs的检测器试图从感兴趣的区域中学习到深层次的特征,并根据所学到的特征进行分类。但是,CNNs往往无法有效地检测到复杂场景下较小的像素块(16像素×16像素),主要原因是其背景和前景具有较高的相似性,小目标本身携带的信息量十分匮乏,与背景外观十分相似,这导致前景和背景分离困难。例如,很难将面孔(目标)与手(背景)分离,或将船只(目标)与波浪(背景)分离。另外,CNNs检测器往往采用粗粒度卷积步长,其步长较大,模型很容易遗漏小目标,或者将更多的背景信息融入到小目标特征的提取过程中。更严重的是,池化层具有下采样作用,在经过几次池化后,小目标特征图的有效特征便消失了。因此,基于CNNs的目标检测算法很难准确地检测出复杂场景下的小目标。

目前,拥挤场景下小目标检测的思路可总结为以下3类。

(1)直接使用深度学习网络提取尺度不变特征 [60] 。但是,当目标尺寸变得太小时,小目标的外观质量会降低,检测器性能会大幅下降。

(2)尝试在物体边界框的内部生成额外的信息,以提高特征的区分性。文献[24]已经证明对图像金字塔的低层插值,非常有利于检测小目标。然而盲目地增加图像的尺寸,往往会使算法计算复杂度大大提升。

(3)尝试将物体的邻域信息整合到物体检测的框架中 [61]

是否还有其他方面的信息可以提升小目标检测的性能呢?答案是上下文信息似乎可以提升小目标检测的性能。但问题又来了,如何有效地对物体的上下文信息进行编码呢?

现有的检测方法通常在其分类打分上使用一个简单的阈值来确定最终的前景和背景。如图3.2中第一阶段所示,选择一个对于任何场景都最优的阈值是十分困难的。本章使用语义信息对目标候选区域进行聚类,将其聚类为感兴趣的对象组或背景组。该方法通过上下文信息将包含相近外观的候选区域聚类到同一组,而背景则远离这样的组。

为此,本章提出了一种基于判别学习和图割(Discriminative LearningandGraph-Cut,DLGC)的框架,用来进一步分类由其他目标检测器产生的候选区域,如图3.2所示。DLGC先使用一个高召回率的分类器,旨在召回图片中所有候选目标所在的区域,但不可避免地会引入许多虚假目标。该方法的重点是重新筛选低置信度的感兴趣目标区域,同时剔除虚假背景。为此,本章提出了一种判别式学习的算法,用来学习相似度矩阵,以评估候选区域的相似度。建立图模型来表示候选区域的相似度矩阵,利用图割技术将图模型分为:同一组是相似的候选区域、不同组是彼此不同的候选区域。然后,每个组内的候选区域通过投票算法来确定是否为目标类或背景类。

图3.2 本文提出基于DLGC的小脸检测框架

本章的主要贡献如下:

(1)为了提高检测性能,本章利用目标的上下文信息提出了一种上下文信息指导的小目标检测方法。

(2)为了描述上下文信息,本章构造了成对的约束,并将其引入小目标检测器中,以提高其检测精度。

(3)为了实现成对约束,本章将回归候选者之间的相似性问题转化为分类两个候选区域是否为一对的二分类问题。 244ID+MiJoMRwIqw8Wxx1VkR0WezQrfRza9z2lWR5b7lIYvu07n3QbKMjdNNflIf

点击中间区域
呼出菜单
上一章
目录
下一章
×