基于语义计算的小样本图像分类研究最新章节_刘崇文著

2.1 引言

由于自然场景的特点是包罗万象，某些类别的场景可能包含的数据较少；此外，在自然场景中，图像中的某些类别的样本出现次数较少，如稀有对象。这两种情况，都会产生小样本问题。根据自然场景的这两种特性，本章将选取拥有小样本类别的自然场景数据库作为研究对象，对在其上面的识别问题作为单源小样本图像分类问题来进行研究。由于这种问题是存在于本数据库内的，本书将其归为单源数据库中的小样本问题。

在应对这种问题时，本书需要利用自然场景图像中各个目标有着较强的语义关系这一特点。图像中所包含的目标存在着一定的语义关系。例如在“沙漠”场景中，就极不可能出现“海”，而出现“沙”的概率就非常高，且在整个图像中所占的比例也会非常大。在本章中，主要对场景的语义和场景中所包含的对象的组合所表达的语义进行分析，试图通过类似文本中语义分析的方法，建立场景类别与对象类别的语义关系，以及对象与其中包含的视觉词汇的语义关系，将其他类别的数据学习到训练数据较少的类别中去，从而解决小样本问题，进一步指导对场景的分类识别。本章所提出的学习方法，有效利用场景类别标注词的语义，挖掘语义中的共性（Commonality）与特性（Distinction），不仅能有效缓解前面所提到的矛盾，而且能通过共性，实现多个场景数据的学习，即跨场景学习。

本书在本章中采用了视觉词汇。视觉词汇能将图像特征与词连接在一起，使图像里面具有一定的语义信息。这就使得我们能采用自然语言处理的方法来解决一些图像分类中的问题。某些对象的概念，与某些场景的共现频率很高，说明两者具有较高的相关性。通过分析潜在语义相关性，可以得到不同场景中，有着不同标注词但可能表示同一个概念的对象，本书称这种对象为“灰样本”。本书利用这些“灰样本”，使之成为能充实训练数据的样本，增加与之语义相关的类别的样本或通过学习到的知识提高模型的泛化能力，从而提高分类识别率。最后，本书在LabelMe数据库上进行了实验，证实了本书的方法能提升分类识别的效果，且增加算法的稳定性。