波段选择技术可以归纳为两大类:非监督波段选择技术和监督波段选择技术。非监督波段选择技术是指不需要除高光谱图像本身以外的任何训练样本或者目标信息等先验知识,只根据图像波段的特点进行波段选择的方法。目前有两大类非监督波段选择方法:基于波段排序的波段选择(往往没有考虑相关性)和考虑了相关性的波段选择方法。
基于波段排序的波段选择方法一般定义某种单波段指标如信息熵(Information Entropy) [61, 76, 77] 、信噪比(Signal-to-Noise-Ratio,SNR) [74] 及信息散度(Information Divergence,ID) [58] 等。如最大方差主成分分析(Maximum Variance Principal Component Analysis,MVPCA) [74] 以主成分变换的基向量和对应方向的信息量加权和的方式计算各个波段的信息量,然后按照该信息量排序,波段的优先次序决定了重要程度。最大信噪比(Maximum Signal-to-Noise-Ratio,MSNR) [74] 按照最小噪声分离变换的基向量和对应方向的SNR,以与MVPCA相同的方法对各个波段的信噪比进行排序,在此基础上进行波段选择。Chang等(2006)以波段的信息散度(ID)对波段进行排序 [58] 。ID被定义为波段直方图分布和其对应的高斯分布的偏离程度,因此ID越大,意味着该波段偏离高斯分布越远,则该波段的优先性越高。在同一篇文章中,作者还提出了基于目标检测算法(Constrained Energy Minimization,CEM) [80, 81] 的波段选择方法CEM-BS及其快速版本线性约束最小方差波段选择(Linear Constrained Minimized Variance Band Selection,LCMV-BS)。这两种方法都是以波段的奇异程度,也就是某波段与其余波段的偏差,来衡量波段的重要性。某个波段如果与其余波段偏离较远,则该波段的信息量较大,因此入选权重也大。可以看出,这些基于波段排序的方法选出的波段往往相关性较大。这是因为高光谱图像波段之间,相邻的波段相关性较大。这就意味着,若某个波段的优先性较高,则其相邻的波段优先性也会较高。因此按照排序顺序选取波段时,很容易就选到相关性较强的波段,这样的选择方法显然并不合理。
一些波段选择方法将波段之间的相关性考虑在内,这些方法的一个共同特点是使用针对多波段的指标。如最佳指数(Optimal Index Factor,OIF)法 [59] 采用三个波段的方差和与它们的相关系数和之比来衡量波段的重要程度。然而当选择的波段较多时,该方法需要反复计算多个波段之间的OIF,这样的计算对于高光谱图像来说几乎是难以完成的。另外直接使用方差与相关系数的比值来兼顾相关性较为生硬。目前比较成功的方法是Sheffield(1985)提出的使用波段在特征空间中构成的椭球体体积最大的指标来进行波段选择,也就是最大椭球体积(Maximum Ellipsoid Volume,MEV) [64] 。然而,遗憾的是,MEV是针对多光谱的波段选择算法,采用了穷举搜索的波段子集搜索算法,对于含有数百个波段的高光谱图像而言,其计算复杂度太高,以致无法计算完成。
另外,还有一些其他的波段选择方法,例如,Wang等(2007) [82] 借用端元提取法NFINDR [83] 的思想,提出使用波段之间构成的单形体体积最大来进行波段选择,该方法可以克服波段之间的相关性。但是波段的体积计算需要对波段降维,而降维一方面具有较大的计算量,另一方面可能会造成一定的信息损失。Sotoca等(2007)提出了一种基于波段之间互信息的波段选择方法WaLuMI [76, 77] ,在此基础上获得的分类效果有所提升,但是该方法的计算速度较慢。Zare(2008)等提出了基于Sparsity Promoting Priors的波段选择方法 [84] ,该方法需要较多的参数。Du(2008)等提出了基于光谱相似性的波段选择方法,使用线性预测(Linear Prediction)作为衡量相似性的指标,并且采用贪婪算法逐个选择波段 [60] 。但是该方法的一个缺点是由于需要多次最小二乘计算,因此计算复杂度较高。Yang等(2011)使用GPU对该方法进行加速实现,发现对于图像大小为350像素×350像素×190波段的高光谱图像可以加速12倍左右 [85] 。Qian等(2009)提出了基于仿射传播(Affinity Propagation,AP) [86] 聚类算法进行波段选择的方法,实现了波段的非高斯性与方差之间的平衡 [62, 79] 。此外,还有其他研究者对非监督波段选择技术进行了研究 [51, 56, 63, 65, 78, 87-91] 。
非监督波段选择技术一般并不针对特定的应用,因此往往难以获得较好的应用效果。监督波段选择技术除了高光谱图像本身,还需要提供一定的训练样本或者目标等先验信息作为波段选择的辅助信息。由于有了额外的信息,监督波段选择技术能获得较好的应用效果。
高光谱图像监督波段选择技术也有了较多的研究,如Bruzzone等(1995)提出了一种基于Jeffreys-Matusita Distance(JM距离)的波段选择方法,该方法选择使两种类别之间的J-M距离最大的波段子集 [92] ,但是该方法仅适用于两个类别。Bruzzone等(2000)又在此基础上提出了适用于多类别的波段选择算法 [93] 。Huang等(2005)年提出了基于特征权重的波段选择方法,在判别分析的基础上,通过给不同样本不同的权重来进行波段选择 [94] 。一些研究者提出了基于支持向量机分类的高光谱图像波段选择方法 [95-97] 。此外,面向分类的监督波段选择算法还有其他一些研究 [94, 98-106] 。这些针对分类的波段选择方法,都需要大量的训练样本。然而,在实际中,大量的训练样本并不容易获得。因此,研究者开始倾向于只需要少量训练样本的波段选择方法。
Keshava(2004)提出了基于光谱角度的波段选择算法—Bands Add On(BAO) [107] 。BAO逐个增加使两个光谱之间夹角增大的波段,但是该方法仅适用于两种类别的区分。Wang等(2007)基于正交子空间投影(Orthogonal Subspace Projection,OSP) [80, 108] 的思想,提出了一种波段监督波段选择方法—Variable-Number Variable-Band Selection(VNVBS) [109] 。VNVBS将目标光谱和参考光谱分割成小的子区间,然后根据各个子区间中目标与参考光谱的正交性来进行波段选择,显然正交性大的子区间对应所需的波段。Yang等(2011)提出了一种只需要少量样本光谱的波段选择方法—Minimum Estimated Abundance Covariance(MEAC),该方法根据线性混合模型,采用贪婪算法,逐个选择使模型误差最小的波段 [110] 。
虽然监督波段选择方法能够获得较好的应用效果,但在实际中,可靠的训练样本并不容易获得,因此非监督方法更合适高光谱图像波段选择 [60, 62] 。
从前面的研究综述可以看出,高光谱图像波段选择问题并没有得到解决,存在的问题主要有以下三个方面。
(1)波段选择鲁棒性低。目前的非监督波段选择算法中,大部分方法都是基于对波段的信息量和相关性进行评估。一般而言,信息量大且相关性小的波段集合是理想的波段子集。然而很多的波段选择方法,并没有考虑噪声和异常波段的影响。众所周知,图像的噪声会使图像的方差变大,而噪声在空间上又是不相关的,也就是说,噪声完全符合信息量大和相关性小的特点,因此现有的算法很容易选到噪声较大的波段,这显然是不合理的。另外,一些非监督高光谱波段选择方法,如IDBS、MVPCA及MEV等都是要寻求使得某准则函数取得极值的波段子集。简单的分析可以看出,这些方法倾向于选择波段集合中的“边界”波段,而这些波段往往是很不稳定的,极有可能受到异常的干扰。因此,亟需研究对噪声和异常鲁棒的波段选择算法。
(2)波段选择计算复杂度高。高光谱图像波段选择的对象是全部波段的高光谱图像,因此面对的数据量是非常庞大的。对于现有的大部分算法而言,其计算速度是不能满足要求的,甚至是难以接受的。然而波段选择的一个目的是为了降低计算量,若波段选择本身需要很大的计算量,往往得不偿失。例如,著名的算法MEV,由于需要极大的计算量,目前也只用于多光谱的彩色化合成,很难用到高光谱图像波段选择中。
(3)没有针对小目标检测的波段选择方法。小目标检测作为高光谱遥感中的一个重要应用获得了极大的关注。然而,现在并没有针对小目标检测的波段选择算法,绝大多数波段选择算法是面向分类的。因此,针对小目标检测的高光谱图像波段选择算法亟待研究。