高光谱图像波段选择技术最新章节_孙康著

2.2　高光谱图像波段选择的基本概念

本节从高光谱图像特点出发，分析高光谱图像处理技术的关键问题，论述波段选择在高光谱图像预处理技术中的必要性、基本概念及研究内容。

2.2.1　高光谱图像的特点

如第1章所述，成像光谱仪以极高的光谱分辨率同时对地物的数百个波段成像，获得具有丰富光谱信息的高光谱图像（数据），从而实现了空间维信息和光谱维信息的革命性结合。由于同时具有空间维信息及光谱维信息，高光谱图像具有其他图像难以比拟的诊断性（Discriminative）特征信息。因此，高光谱遥感在众多领域，如环境评估、资源调查及农业、林业等领域有着极为广泛的应用。然而，由于针对高光谱数据处理技术的匮乏，加之传统的信息处理手段并不完全适用于高光谱图像处理，因此高光谱图像处理和应用也面临着很大的挑战。

首先是数据量的巨幅增加。高光谱图像具有数百个波段，其数据量是同样尺寸单波段图像的数百倍。以航空传感器AVIRIS获取的数据为例，其获得的原始数据共有224个波段。对于1000像素×1000像素的高光谱图像而言，其具有的像素数目共有2.24×10 ⁸ 个，相当于单波段的图像尺寸为15000像素×15000像素！

庞大的数据量对高光谱数据的传输、存储及后续处理带来了巨大挑战。对于同样像素深度的图像，高光谱图像占据的存储体积是普通单波段图像的数百倍。对于高光谱图像处理而言，则情况更为严重。很多高光谱图像处理随着波段数的增加，其计算复杂度呈波段数目的三次方甚至四次方增加。因此，高光谱图像数据处理的计算量可能是相同尺寸单波段图像的几百万倍，甚至几十亿倍。在计算能力大幅进步的今天，高光谱图像处理的计算复杂度仍然是一个没有解决的问题。

其次是数据的严重冗余。在可见光到中红外范围内，高光谱图像数百个光谱采样使得其光谱分辨率可达到纳米级，如6～10nm是较为常见的采样间隔。密集的采样间隔无疑增加了地物光谱之间的区分性，然而也使得高光谱图像存在严重的信息冗余—波段之间具有极高的相关性。图2-1是Salinas数据各个波段的相关系数图。

图2-1　Salinas数据各个波段的相关系数图

从图2-1可以看出，Salinas数据相邻或相近的波段之间存在严重的信息冗余，很多波段之间的相关系数达到甚至大于0.95。在波段1～40、112～152及168～220范围内，各个波段严重相关。波段间强烈的相关性使得在高光谱图像处理时，一些模型求解陷入病态，导致模型的解不稳定甚至错误。

再次是维数灾难现象的存在。维数灾难现象（Hughes phenomenon） ^[31] 是指当训练样本一定时，随着维数的增加（信息量的增加），分类精度反而降低的现象。简单地说，就是数据维数的增加并不一定带来应用效果的提升，甚至还会降低一些应用的效果。这是由于很多的数据处理算法，尤其是基于统计学习的算法，需要将数据描述成参数化的模型，而随着维数的增加，模型的参数的规模呈更高速度增加趋势，也就更难准确地获得。因此在很多情况下（比如分类），维数的增加往往会降低应用效果（分类精度）。

降维（Dimensionality reduction）是解决以上问题的有效途径 ^{[6, 32-34]} 。通过降维，高光谱图像的数据量会降低，相关性会得到抑制，维数灾难的现象会得到缓解甚至克服。这样，降维作为一种高光谱图像的预处理手段，在高光谱图像处理中起到了至关重要的作用。因此，研究有效的降维技术是高光谱图像处理的一个重要课题。

2.2.2　波段选择的必要性

虽然高光谱数据可以提供传统遥感数据难以提供的光谱信息，然而这是以较高的数据维数及极大的数据量为代价的。由于高光谱数据具有与传统遥感数据不同的特点，使得传统的遥感数据处理方式并不适用于高光谱遥感数据处理。目前，高光谱数据处理的挑战性主要体现在以下几个方面。

（1）高光谱数据量极大。由于高光谱遥感同时对数百个波段连续成像，因此相对于同样尺寸的普通彩色或者单波段图像而言，高光谱的数据量是普通遥感图像的几十倍甚至数百倍。

（2）数据相关性大。高光谱数据的光谱分辨率很高（一般为5～10nm），使得高光谱图像的相邻波段间具有极高的相关性。对实际的高光谱数据分析表明，其相邻波段间的相关系数有时高达0.99。

这给高光谱图像应用带来了以下问题：①数据获取、传输以及储存量大。由于高光谱图像的数据量极大，因此给数据获取、传输和储存等带来了很大的压力。②计算量大。由于高光谱图像数据量大，一个随之而来的问题是计算量极大，因此一个简单的应用对于高光谱图像来说，其计算复杂度也是极高的。这给硬件带来了很大的挑战。③维数灾难。在数据分类时，人们观察到，当训练样本数量较少时，数据的分类精度随着维数的增加反而下降，这就是著名的“维数灾难”现象 ^{[31, 35]} 。高光谱由于极高的维数使其在分类时受“维数灾难”的影响很大，如图2-2所示，其中，m为训练样本数目。

图2-2　维数灾难，当训练样本一定时，分类精度随着数据维数的增加反而降低

为了解决以上问题，就需要对高光谱数据进行降维 ^{[33, 36]} 。总的来说，降维技术可以分为两大类：特征提取（Feature extraction） ^{[6, 37-49]} 和特征选择（Feature selection） ^[50-65] 。

特征提取是指通过对原始特征的组合或者映射得到新的特征，使得新的特征具有较大的信息量、较低的相关性或者较大的独立性等特点。典型的特征方法包括主成分分析（Principal Component Analysis，PCA） ^[66] 、独立成分分析（Independent Component Analysis，ICA） ^[67-70] 及最小噪声分离（Minimum Noise Fraction，MNF） ^[71] 等方法。这些方法是线性特征提取方法，通过对原始波段的某种线性组合，以期新的特征具有较大的信息量（方差）、独立性（非高斯性）及信噪比。此外，还有一些监督类型的线性特征提取（Supervised feature extraction）方法，如线性判别分析（Linear Discriminative Analysis，LDA）等 ^{[39, 40, 46, 47, 49]} 。线性特征提取方法由于模型简单，使用方便等特点在高光谱图像处理中得到了广泛的应用。然而高光谱数据具有较高的维数，在特征空间（Feature space）中可能具有复杂的非线性结构。使用线性特征提取方法难以描述高光谱数据的非线性结构，因此近些年来，也有一些非线性特征提取方法 ^{[32, 43, 49, 72, 73]} 应用在高光谱图像处理领域。然而，非线性模型较为复杂，并且可能涉及较多参数，因此在高光谱图像处理中的应用受到限制，目前还处在初级探索阶段。

另外一种常用的降维手段是特征选择，在高光谱图像处理领域也称为波段选择，是指从一个较大或者全部波段集合中选择一个较小的波段子集作为新的特征的方法。其降维的方式是通过直接去除一些冗余波段实现的。波段选择近些年受到越来越多的关注，并且正在成为高光谱图像预处理技术的关键技术之一。这是因为相对于特征提取，波段选择具有以下优势。

（1）保持特征的物理意义。特征提取得到的特征是原始特征的某种组合，因而丧失了原始波段的物理意义。而波段选择得到的特征是原始波段集合的子集，因此，可以保留原始波段的物理意义。在一些需要定量的应用场景中（如植被参数反演及资源调查等），保留波段的物理意义是至关重要的。

（2）减轻高光谱数据传输及存储负荷。高光谱图像具有极大的数据量，给数据的传输、存储带来了很大挑战。特征提取和波段选择虽然都可以降低计算复杂度，但是对于高光谱数据的传输、存储压力，二者有不同的表现。特征提取在获得新的特征时，需要全部原始特征的参与。换句话说，特征提取必须在全波波段都获得的前提下才能进行，因此并不能降低高光谱数据的传输和存储压力。波段选择则在很大程度上取决于各个波段之间的相关性，对于同一传感器的波段选择结果具有一定的稳定性。因此，完全可以只传输和存储某些波段子集的数据，从而减轻高光谱数据传输、存储压力。

（3）多光谱传感器波段设置。多光谱遥感只对一些特定的波段进行成像，与高光谱数据相比，具有数据量低、空间分辨率高等特点。很多多光谱传感器只针对某种特殊应用，这种情况下，一些特定波段就可以解决问题，而波段的设置是十分关键的问题。通过对高光谱图像波段选择，可以模拟得到这些关键的波段。不仅如此，这些波段组合在应用中的效果还可以得到可靠的评估。反观特征提取，由于得到的特征失去了物理意义，对波段设置难以提供有价值的参考。

（4）物性的理解。一般而言，不同的物质在光谱上会有不同的表现，但也可能由于光谱分辨率及光谱范围的限制表现为异物同谱（本书的研究范围不考虑此种情形）。在数百个波段中，往往只有少数波段在地物彼此区分中起到了关键作用。通过波段选择，可以找到这些特定波段，从而提高对物体性质的认识。

综上所述，波段选择作为一种降维手段，可以有效地缓解甚至克服高光谱图像处理中遇到的一些基本问题。相对于另外一种降维手段，特征提取，波段选择具有较大的优势。因此开展波段选择技术的研究，对于高光谱图像处理具有重要的意义。

2.2.3　波段选择的研究内容

高光谱图像波段选择的基本流程图如图2-3所示。波段选择最根本的问题是应该选择哪些波段，这个问题事实上涉及两部分内容：波段子集评价及波段子集搜索，如图2-3中阴影模块所示。

图2-3　高光谱图像波段选择的基本流程图

波段子集评价是指针对某一特定波段子集，给出一个定量的指标用来评价该子集的性能优劣。评价指标也常称为代价函数（Cost function）、目标函数（Objective function）及准则函数（Criterion function）等。常用的评价指标包括信息量（方差） ^{[59, 64, 74]} 、信息散度（Information divergence） ^[58] 、相似性（Similarity） ^{[60, 75]} 及独立性（Dependence） ^{[76, 77]} 等。使用这些指标时，对于一个特定的波段子集，通过函数映射方法可以得到一个数值，而该数值描述了该子集的性能。还有一些方法使用应用效果对波段子集进行评价，这类方法一般为监督方式，需要一定的训练样本。使用这种方法时，对于一个特定波段子集，首先将它们带入应用场景，并将得到的应用效果作为性能优劣的评价。例如，一些方法直接使用分类精度作为波段子集评价指标 ^{[54, 55, 60, 62, 75, 78, 79]} 。一个好的波段子集评价指标应具有应用效果好、鲁棒性强及易于计算等特点。

在设计了准则函数以后，如何找到使得准则函数达到最优的波段子集是另外一个难题，也就是波段子集搜索问题。事实上，波段子集搜索是一个组合优化问题，对于一般的准则函数，只有穷尽所有的波段组合，才能找到使得目标函数获得最佳值的子集。对于高光谱图像而言，由于波段的数目通常在数百以上，穷举波段子集的方法由于需要巨大的计算量而难以完成。因此，波段子集搜索的核心问题是如何准确同时高效地搜索得到满意（未必最优，且一般不是最优）的波段组合，波段子集搜索可以理解为波段选择效果和效率的折中问题。

波段子集评价函数及波段子集搜索策略是波段选择两个最为基本的问题。波段子集搜索策略通常需要针对特定准则函数设计，但有时也会耦合嵌入在波段子集的准则函数的设计之中。

2.2 高光谱图像波段选择的基本概念

2.2.1 高光谱图像的特点

2.2.2 波段选择的必要性

2.2.3 波段选择的研究内容

2.2　高光谱图像波段选择的基本概念

2.2.1　高光谱图像的特点

2.2.2　波段选择的必要性

2.2.3　波段选择的研究内容