鉴于SAR ATR技术在军事和民用应用领域都有巨大潜力,自20世纪90年代以来,世界各国相继投入了大量的人力和物力对其开展研究。很多著名的科研机构对SAR ATR技术进行了深入的研究,并取得了一系列振奋人心的科研成果。相对于国外对ATR技术的研究,我国在该方面的科研工作起步相对较晚,但已有很多高等院校和研究所针对该领域展开了研究,如国防科学技术大学、电子科技大学、武汉大学、北京理工大学、北京航空航天大学、中国科学院电子学研究所、中国空间技术研究院、中国电子科技集团14所和38所、西安电子科技大学等科研单位,取得了一系列研究成果。虽然目前与美国等发达国家相比,我国对SAR ATR技术的研究水平还存在较大的差距,但在科研工作者的不断努力下,也取得了大量的成就。一般来讲,SAR自动目标识别方法可归纳为两大类:基于模板匹配的识别方法和基于模型的识别方法。
1.基于模板匹配的识别方法
基于模板匹配的识别方法中最著名的是由美国国防部高级计划研究署(Defense Advance Research Project Agency,DARPA)和空军实验室(Air Force Research Laboratory,AFRL)启动的半智能自动图像处理[Semi-Automated IMINT(Image Intelligence)Processing,SAIP]计划。
SAIP计划是由麻省理工学院(Massachusetts Institute of Technology,MIT)的林肯实验室负责进行的,是基于模板匹配的SAR ATR系统。采用基于模板匹配的识别法时,首先,产生各个目标在不同方位区间上的模板,每个模板都反映目标在该方位区间内的目标特性;然后,将待识别的目标与所有目标的模板按照某种匹配准则(常见的有最小均方误差、最小欧氏距离、最小余弦距离、最大相关系数等)进行对比,挑选出和待识别目标最匹配的模板,将其所对应的目标类别作为识别结果输出。
模板匹配目标识别方法的原理相对简单,也易于工程实现,但其识别性能在不同的条件下差别较大。在测试样本和训练样本的成像条件较接近的情况下,该方法往往能够得到令人满意的识别结果,而且当待识别目标的类别增加时,已训练好的目标模板不需要进行重新训练,只需要建立新增目标的模板即可,比较方便。该方法的缺点是,由于目标的后向散射对雷达入射波的俯仰角、目标方位角和周围环境等因素都比较敏感,所以很难建立起完备的目标模板库,而且随着目标类别的增加,模板总数会相应地大量增加,因此需要大量的存储空间来储存模板,匹配得到识别结果的运算时间也会随之大幅度增加。
2.基于模型的识别方法
简单地说,基于模型的识别方法的核心思想是:首先提取出训练样本和测试样本的有效特征,继而将测试样本的特征和训练样本的特征进行比较,根据比较的结果判断测试样本的类别、属性或型号等。该方法的优点是数据存储量较小、处理速度快、分辨能力强,能够适应不同情况的工作条件。
总结国内外SAR ATR技术的研究工作可以发现,和基于模板匹配的识别方法相比,基于模型的识别方法越来越受到国内外科研机构和学者的欢迎。因为基于模型的识别方法对复杂电磁环境中的目标识别的适用性和健壮性更强,是SAR ATR技术的必然发展趋势,因此本书介绍的主要内容也正是基于模型的SAR ATR方法。基于模型的SAR ATR方法主要有以下3个步骤:①SAR图像预处理;②特征提取;③分类识别。其流程图如图1-1所示。
图1-1 基于模型的SAR ATR方法流程图
1)SAR图像预处理
原始的SAR图像中不仅包含感兴趣的目标,还包含大量的背景杂波,而且目标位置的平移及不均匀的散射等因素都会对特征提取和分类判别算法的性能产生影响,因此在特征提取之前,要先对SAR图像进行行之有效的预处理,通过预处理成功地提取出感兴趣的目标所在的区域,去除或减小冗余的背景杂波(树木、建筑物、河流等)和噪声的影响,以提高ATR算法的性能。预处理的过程主要包括对原始SAR图像的滤波、分割、调整图像像素值的动态范围等。
2)特征提取
伴随着SAR系统的性能和能力的逐步优化,SAR成像技术获得了持续的进步和发展,SAR图像具有了更高的分辨率和更大的测绘带宽,因此SAR图像中包含的目标信息也越来越多样和丰富。在目标识别中,特征提取是基于模型的识别方法的关键和难点。特征提取的目的是从目标的众多特征中找出最有效的特征以进行识别,好的特征提取算法可以有效地压缩数据的特征维数,去除图像中的冗余信息,提高识别的性能,同时降低时间复杂度和计算复杂度。特征提取算法的好坏直接决定了识别结果是否正确有效。
理想的特征应该具备类内凝聚性和类间差异性。所谓类内凝聚性,是指同一个目标在不同成像条件下的观测值在特征空间中彼此靠近;而类间差异性,是指提取的特征能有效揭示不同类别目标的本质差异,使不同类别的目标在特征空间中能够有效分离。
目标的特征按照属性主要可以划分为物理特征和数学特征两大类。
物理特征与目标实际的物理特性和物理构造相关,是目标最基本的特征。常用的物理特征有目标的散射中心位置、强度、峰值、目标的面积和周长、目标阴影部分的面积和周长、最小目标长度、最大目标长度等。例如,美国加州大学智能系统研究中心提出目标的散射中心位置、强度和峰值等物理特征可以用于分类识别。在SAR图像中,峰值就是图像中的局部极大值,通常对应目标或背景的散射中心。对坦克、装甲车等地面目标的SAR图像来说,峰值主要对应车轮、炮筒、油箱等具有强散射结构的散射中心。美国俄亥俄州立大学的Gerry等人经过仔细研究,根据几何绕射理论、物理光学理论,提出了属性(Attributed)散射中心模型,利用该模型来描述感兴趣目标的后向散射特性,提取出的特征包含了更为丰富的可用于目标识别的有效信息,最终较好地实现了目标识别。国防科学技术大学的周建雄等人认为,散射中心特征能有效地反映目标的雷达特性,提出了一种基于全局散射中心模型的SAR ATR算法。美国宾夕法尼亚大学的S.Papson等人提出了一种利用目标阴影作为特征的目标识别算法,但也指出,仅仅利用目标阴影作为特征不能很好地区分变形目标,而且想要准确地提取所有目标的阴影很困难,需要和其他特征相结合以改善识别的结果。韩国浦项科技大学的Jong-Il Park等人提出了最小目标长度、最大目标长度等12个新的特征用于实现基于高分辨SAR图像的目标识别。西安电子科技大学的杜兰等人认为,仅仅使用幅度特征会限制识别的性能,为了进一步提高SAR图像目标识别的性能,提出将多级幅度特征和多级密集尺度不变特征相融合实现目标识别。南京理工大学的曹娜等人提出,识别时首先分割出目标区域和目标的阴影区域,再将两者结合起来可更好地表示图像,有效地提高了SAR图像目标识别的准确度。
数学特征是指通过某种数学变换对图像数据进行映射,从而得到更简洁有效的数据表达形式。数学特征的提取通常不考虑目标的相关信息和先验知识,只是通过纯粹的数学方法对图像数据进行处理,因此一般没有实际的物理意义。常用的数学变换有傅里叶变换、非负矩阵分解理论、小波变换、Randon变换、Gabor变换等。由于数学特征具有计算量小、分类性能好、普遍具有成熟的实现算法等特点,因此引起了越来越多的关注。美国佛罗里达大学的Li Jian等人将SAR图像的傅里叶系数和幅度系数相融合作为特征,采用Adaboosting分类器同时实现特征的融合和分类识别。电子科技大学的龙泓琳等人将非负矩阵分解理论应用于SAR图像处理,将原始的大矩阵近似分解为低秩形式,在减少了数据运算量的同时获得了较好的识别率。美国佐治亚理工学院的Nilubol C.等人采用Radon变换获得了目标具有平移、旋转不变性的特征,从而实现SAR图像目标识别。杭州电子科技大学的徐英等人采用多尺度分型特征对SAR图像进行特征增强,分割后得到目标的二值图像,再进行目标方位角估计,结合原始图像进行模型训练得到目标识别结果。
数学特征中的子空间分析法因其具有计算复杂度较低、描述能力较强、易于实现等特点,而被广泛应用于特征提取算法。子空间分析法的基本思想是:首先根据目标函数确定某种空间变换矩阵,通过该矩阵将高维空间的数据或信号投影到一个低维空间中,从而使高维空间中需要用多维特征表示的信号或数据只需要较少的维数就可以有效地描述。这样可以大大降低信号或数据的维数,有效提高运算效率。目前,学术界提出的子空间分析方法很多,比较流行的主要有主成分分析(Principal Component Analysis,PCA)算法,以及在PCA算法基础上发展起来的核函数主成分分析(Kernel Principal Component Analysis,KPCA)算法。相比于PCA算法,KPCA算法对小样本数据更具优势。此外,还有线性判别分析(Linear Discriminant Analysis,LDA)算法、在LDA算法基础上发展起来的核函数线性判别分析(Kernel Linear Discriminant Analysis,KLDA)算法,以及独立成分分析(Independent Component Analysis,ICA)算法等。
经典的子空间分析法(如主成分分析和线性判别分析等)都是在假设数据是全局线性结构的前提下,基于传统欧氏空间的线性降维方法。但是,SAR相干成像的复杂性导致SAR图像空间中存在局部的流形结构,往往对目标的识别更加具有指导作用。降维时考虑数据的流形结构能更好地捕获目标的流形特征,实现高识别率的SAR图像目标识别。流形学习是近年来出现的一种新型机器学习理论,该理论将人类对事物的感知能力引入了机器学习。它具有强大的对数据的准确描述能力,期望能够充分利用其特点,捕获高维空间中数据分布的潜在规律。流形学习在更符合数据实际分布的流形空间中进行特征提取,比传统的基于欧氏空间的子空间方法对数据的描述能力更好,同时可以有效降低数据的维数。
经典的基于流形学习的特征提取算法有美国斯坦福大学的Tenenbaum J.B.等人提出的等距特征映射(Isometric Mapping,ISOMAP)算法、英国伦敦大学学院的Roweis S.T.和AT&T实验室的Saul L.K.共同提出的局部线性嵌入(Locally Linear Embedding,LLE)算法和美国芝加哥大学的Belkin M.和Niyogi P.共同提出的Laplacian特征映射(Laplacian Eigenmap,LE)算法等。上述算法均是有代表性的非线性流形学习算法,能够有效揭示高维数据内在的几何结构。上述算法的共同缺点是没有明确的投影矩阵,无法直接对测试图像进行投影,每出现一个新样本,都要把之前所有的训练样本再次用流形学习算法学习一遍,计算复杂度非常高,无法直接用于解决模式识别问题。因此,一些线性近似方法相继被提出,如美国芝加哥大学的Xiaofei He等人提出的局部保持投影(Locality Preserving Projections,LPP)算法和近邻保持嵌入(Neighborhood Preserving Embedding,NPE)算法,以及中国科学技术大学的庞彦伟等人提出的近邻保持投影(Neighborhood Preserving Projections,NPP)算法等。其中,LPP算法是LE算法的线性近似,NPP算法和NPE算法是LLE算法的线性近似。这些线性近似算法共同的优点是在保留数据内在几何结构信息的前提下,能够给出明确的投影矩阵,极大地方便了处理新数据,降低了流形学习算法的复杂度,处理光学图像能得到满意的结果。针对SAR图像,也有很多有效的基于流形学习的目标识别算法被提出。例如,电子科技大学的黄钰林等人提出了一种基于流形学习的近邻几何中心缩放嵌入(Neighborhood Geometric Center Scaling Embedding,NGCSE)算法,可以使每个样本点都和它的近邻点中属于同一类的样本靠近,而和它的近邻点中属于不同类的样本远离,有效提高了SAR图像目标识别的识别率。电子科技大学的黄钰林等人则提出了一种基于流形学习的样本判别分析(Sample Discriminant Analysis,SDA)算法,该算法是基于矩阵的二维降维算法,可以使得同类样本降维后的距离变近,不同类样本降维后的距离变远,实现了高识别率的SAR图像目标识别。
近年来提出的大数据概念几乎涵盖了国计民生的各个方面,如雷达回波数据、音频数据、天文数据、地震数据、工业控制数据、基因数据等。如何对这些数量庞大的数据实现灵活、简洁和自适应的表示逐渐成为人们关注的问题。稀疏表示是最近在数学、统计学、信号处理及图像处理领域蓬勃发展的新方法,是当前国内外的研究热点,已被广泛应用于图像处理、数据压缩、成像算法研究、目标追踪、模式识别等诸多领域。经典的信号描述方法(如傅里叶变换、离散余弦变换、小波变换等)的共同特点是信号的表示形式是唯一的,一旦基函数被确定下来,每个信号就都只有唯一的表示方法;如果信号的特征与基函数不完全匹配,就会导致所获得的结果不是信号最稀疏的表示形式。研究信号的稀疏表示是为了将信号在基函数张成的空间中用很少的非零系数来表示,从而为信号处理提供一种更直接、简便的分析、处理方式。对信号进行稀疏表示的两个关键因素是字典矩阵设计(基函数的确定)和稀疏分解算法。设计字典矩阵的目的是找到一个合适的字典矩阵,使信号能够用这个字典矩阵中少量的原子进行线性表示,且逼近误差尽可能地小,而稀疏分解算法则是为了实现快速、准确的信号稀疏分解。
采用稀疏表示进行识别的主要思想是测试样本可以用少量的训练样本进行线性表示,并且这些训练样本在理论上应和测试样本属于同一类别。采用稀疏表示进行目标识别时,首先利用所有目标的训练样本构造字典矩阵;其次将测试样本在字典矩阵上进行投影,计算测试样本的稀疏向量,分别提取出对应每类目标的训练样本的稀疏系数;然后根据每类目标的训练样本和其对应的稀疏系数对测试样本进行重构,计算重构误差,最小的重构误差对应的目标类别被判定为测试样本所属的类别。针对SAR图像,也有很多有效的基于稀疏表示的目标识别算法被提出。例如,西北工业大学的张海超等人提出了一种基于多视角的稀疏表示(Joint Sparse Representation,JSR)的算法,在稀疏表示算法的基础上加入了多方位角信息进行联合判断以得到最终的识别结果。该算法不需要首先对测试目标进行方位角估计,而且能挖掘出同一个目标在不同方位角下的图像之间的关系,利用这种相互关系给出共同的(Joint)识别结果,有效提高了识别率。国防科学技术大学的董刚刚等人提出了一系列基于单演信号(Monogenic Signal)的稀疏表示算法,实现了高识别率的SAR图像目标识别。
由上述可见,流形学习算法和稀疏表示理论在对数据进行描述时各具独特的优势。近年来,很多学者提出将两者结合进行特征提取,以使提取的特征能够同时具有两者的优点,从而可以更好地进行后续处理。总结国内外特征提取方面最新的研究工作,可以把将流形学习和稀疏表示相结合进行特征提取的算法归为以下两类。
(1)把流形学习算法的目标函数加入稀疏表示理论的目标函数,作为稀疏表示的约束项(平滑项),以得到能保持数据某种流形特性的稀疏向量。例如,浙江大学的郑淼等人提出了一种基于图论的稀疏编码算法,将Laplacian正则矩阵融入稀疏表示的目标函数中作为其平滑项,使得到的稀疏向量在具备稀疏性的同时,能够保持数据的局部流形结构;并进行光学图像的分类和聚类试验,验证了其有效性。西安电子科技大学的张向荣等人提出了使用一种将局部流形结构作为约束条件的稀疏表示算法进行行为识别,在对测试样本进行稀疏表示时倾向于优先选择和测试样本处于相同流形空间的训练样本,从而提高了稀疏向量的简洁性和判别能力。中国科学院西安光学精密机械研究所的卢孝强等人提出了使用一种能保持数据内在几何结构的稀疏表示算法实现目标追踪。该算法认为如果两个样本属于彼此的 k 个近邻点,则它们的稀疏向量仍然属于彼此的 k 个近邻点,试验结果验证了其有效性。
(2)把数据的稀疏特性融入流形学习算法,得到能保持数据稀疏特性的投影矩阵。例如,南京航空航天大学的乔立山等人考虑到数据的稀疏向量能反映数据的内在几何结构且具有判别能力,采用稀疏表示理论计算近邻保持嵌入NPE算法中的近邻关系矩阵,提出了一种先进的稀疏保持投影(Sparsity Preserving Projections,SPP)算法,能保持降维前后数据的稀疏性,并通过人脸识别验证了所提算法的有效性。由于非负稀疏表示相比于稀疏表示能更好地反映数据的实际分布并具有更好的判别力,香港科技大学的W.K.Wong给SPP算法添加了非负约束条件,提出了非负稀疏保持嵌入(Non-negative Sparseness Preserving Embedding,NSPE)算法,以更好地实现人脸识别。为了提高SPP算法的判别效果,中国科学院自动化研究所的桂杰等人提出了判别稀疏近邻保持嵌入(Discriminant Sparse Neighborhood Preserving Embedding,DSNPE)算法,该算法是对SPP算法的改进,在SPP算法的目标函数中加入了最大边缘准则(Maximum Margin Criterion,MMC)目标函数,使得到的投影矩阵在保持降维前后数据稀疏性的同时,还具有判别力。
3)分类识别
在特征提取后,接下来的步骤就是利用提取的特征实现分类数据的处理,达到尽可能准确分类的目的。所谓分类,就是利用已有的知识和信息等,通过对大量数据进行训练学习获得有效的分类器,然后将待分类样本在该分类器上进行映射,根据映射结果判断待分类样本所属类别的过程。
基于欧氏距离的最近邻分类器因具有原理简单、容易执行等优点,是最常用的分类方法之一。除此之外,基于隐马尔可夫模型(Hidden Markov Model,HMM)的分类器、适用于小样本数据的支持向量机(Support Vector Machine,SVM)分类器、AdaBoosting分类器、经典的贝叶斯分类器、神经网络(Neutral Network,NN)等也是较为常见的分类方法。例如,美国佛罗里达大学的Zhao Qun等人将SVM分类器引入SAR ATR领域,试验结果显示,SVM分类器明显优于传统的分类器(神经网络和模板匹配),而且采用高斯核函数的SVM分类器具有更好的拒识性能(判别非训练样本数据库中数据的能力);Li Jian等人采用Adaboosting分类器同时实现了特征的融合和分类识别;洛克希德·马丁公司的Dane P.Kottke等人采用基于HMM的分类器实现了SAR图像目标的分类判别;美国华盛顿大学的Joseph A.O'Sullivan等人首先采用条件高斯模型和Rician模型对SAR图像进行建模,然后采用贝叶斯分类器同时实现了目标方位角的估计和目标识别。