基于土地利用类型在水力侵蚀定量评价中的数据需求,构建满足水力侵蚀定量计算的土地利用类型的分类方案;借助实地调查等手段获取土地利用类型的先验知识,建立遥感影像解译样本数据集;充分挖掘土地利用类型在高分遥感影像中的光谱、形状、纹理、上下文关系等特征,协同多源数据,综合多尺度分割、多阈值分割多种分割方法以及面向对象分类、像素级分类等多种分类方式,建立分类策略,融合多种算法建立土地利用类型提取规则集,结合专家知识控制的后处理方式,实现土地利用类型工程化快速提取,兼顾分类精度和效率,满足水力侵蚀定量评价需要。总体技术路线如图4.1所示。
图4.1 总体技术路线图
1.分类方案构建思路
参照现有土地利用类型分类标准规范,针对高分遥感数据的特点和水力侵蚀定量评价的业务需求,构建适合水力侵蚀定量计算的高分遥感土地利用类型的分类方案。充分考虑行业间数据的共享性和兼容性,尽量与国标分类体系保持一致或在其基础上进行细分和归并。
2.分层提取策略
在水力侵蚀土地利用类型分类方案的基础上,确定分层提取的策略,逐层控制,逐层净化。通常,在植被覆盖较多的地区,先区分水域及非水域,再区分植被和非植被,然后再进行其他地类的提取。而在示范区,由于植被的光谱信息相对较弱,不容易与其他地类区分,因此将植被放在最后提取。示范区分层提取策略如图4.2所示。
图4.2 示范区分层提取策略
3.面向对象分类策略
在建立解译标志的基础上,根据对象的解译特征、先验知识、经验方法,从上百种面向对象的分类算法中进行筛选,确定针对示范区每一类土地利用类型提取的算法集。充分考虑可工程化实现以及可推广应用的原则,通过算法优化和整合的对比实验,打造多种算法协同的规则集,规则集应具有一定的区域适用性,算法相对固定,参数可灵活调整。分类过程中,充分利用辅助数据降低分类难度、提高分类精度和效率。
4.分类后处理策略
本着自动化、批量化、流程化及可工程化实现的原则,尽量减少人工修正的工作量,对自动分类的结果进行类型合并、图斑及属性修正等分类后处理。对严重影响水力侵蚀的土地利用类型必要时借助充分的专家知识控制提高其精度;对水力侵蚀影响较小的土地利用类型以自动化处理为主。
采用面向对象的分类方法进行土地利用类型提取,面向对象分类首先需要基于影像分割得到分类的基础对象,因此需要对分割、分类的技术方法进行研究、总结,确定采用的分割、分类方法。
1.影像分割
影像分割是遥感信息提取和目标识别的基础,也是实现面向对象分类的关键步骤。面向对象的遥感影像分析方法中影像的最小单元不再是单个的像素,而是一个个对象,即具有相同特征的“同质区域”。在进行面向对象分类时,首先需要借助影像分割算法通过分割获取一个个对象,然后基于对象的分类特征再进行影像分类。影像分割方法非常多,常用的有棋盘分割、多阈值分割、多尺度分割,每种分割方法各有自己的适用性。
(1)棋盘分割。棋盘分割是自顶向下的分割方式,将影像或感兴趣区域分成若干所定义尺寸大小的方形对象,分割速度最快。通常,设置一个较大的对象尺寸,利用棋盘分割提取矢量图层下的感兴趣区域,在后续操作中,不再对感兴趣区外的影像对象进行处理,以提高运算速度。GF-1影像棋盘分割示例如图4.3所示。
图4.3 GF-1影像棋盘分割示例
(2)多阈值分割。多阈值分割指通过设定多个阈值将图像中感兴趣的目标标记出来,根据图像的灰度,设定多个阈值,然后令图像中的每一个像素点的灰度与阈值作对比,之后将其归类。多阈值图像分割是一个模式识别归类的过程。阈值的选取非常关键,它关系到分割结果的好坏。多阈值分割实现简单、计算量小、运算速度快,性能较稳定。但是多阈值分割只能一个波段参与运算,不能充分利用多波段的光谱信息,而且仅仅依据影像的光谱特征,不能有效利用地物的形状、纹理、拓扑关系等特征。因此,多阈值分割多用在仅用一个波段的光谱信息就能明显区分目标地物与其他地物的情况下。多阈值分割需要确定以下分割参数:①分割完成后最小图斑的大小;②参与分割的图层(单个图层,可以为影像的单个波段或波段运算形成的灰度图像);③在该图层上的阈值范围(即有效区分不同地类的临界灰度值)。影像多阈值分割示例如图4.4所示。
(3)多尺度分割。多尺度分割,是自下而上的分割方式,主要是根据影像的光谱信息,设定光谱、形状、紧致度、光滑度等参数,对影像进行分割,划分出许多影像区域,成为分割后的对象。GF-1影像多尺度分割示例如图4.5所示。
影像分割的参数设置直接决定着地物的分类精度,多尺度分割需要设置如下参数:①参与分割的波段组合;②分割尺度;③同质性因子。参与分割的波段组合用来设置参与分割的波段的权重,包含影像信息较多的波段或对提取目标地物用处较大的波段可以赋予较大的权重,而其他的无关紧要的波段可以不参与分割或者赋予较小的权重;分割尺度是一个抽象术语,没有明确的单位,它用来确定生成的影像对象所允许的最大异质度,值越大则生成的影像对象的尺寸越大,反之则越小;同质性因子用来表示最小异质性,又由两部分组成,即光谱和形状,两者权重之和为1.0,而形状又由光滑度和紧致度来表示,两者权重之和也为1.0。需要对各类地物进行多次分割实验得出相对最优的分割参数组合。最优分割参数对不同地域、不同影像、不同地物而言并不具有通用性,换一个地域或换一景影像需要重新调整。在研究某一个参数的影响时,需要先固定其他几个参数,以下仅以局部实验区数据为例说明各个参数对分割结果的影响。
图4.4 GF-1影像多阈值分割示例
图4.5 GF-1影像多尺度分割示例
1)分割尺度因子。为了分析不同的尺度阈值对分割结果的影响,在确定形状因子权重、紧致度权重、光滑度权重都为0.5、分割波段组合为1∶1∶1∶1的条件下,分别取尺度阈值为100、300、500为例对影像进行分割,所得的结果如图4.6所示。
图4.6 不同尺度阈值的分割结果对比
由图4.6可以看出,使用不同的尺度阈值分割后的影像信息是有很大差异的。尺度阈值小的影像层中单个多边形对象面积相对要小一些,分割后形成的图斑数量多,较为破碎,适合提取地物面积较小、分布较为零散的土地利用类型;尺度阈值大的影像层中单个多边形对象面积相对要大一些,分割后形成的图斑数量少且图斑面积较大,适合提取地物面积较大、分布连片的土地利用类型。
2)分割图层组合。为了分析不同的波段组合对分割结果的影响,在确定尺度阈值为500、形状因子权重、紧致度权重都为0.5的条件下,分别对样例影像单个波段、不同波段组合进行分割,所得的结果如图4.7所示。
图4.7 不同波段组合对分割结果的影响
不同波段对地物识别的敏感度不同,通过以上实验结果对比发现,参与分割的波段组合及各波段的权重不同,影像分割的结果也不同,在实际应用中,需要根据地物及影像波段特征选择合适的影像波段组合及波段的权重比例。
3)同质性因子。以尺度阈值500、4个波段1∶1∶1∶1组合为例,研究同质性因子中光谱和形状因子权重以及形状因子中光滑度和紧致度权重对分割结果的影响。在研究光滑度和紧致度因子的影响时,需固定光谱因子和形状因子的权重比值,反之,在研究光谱因子和形状因子的影响时,需固定紧致度和光滑度因子的权重比值。不同参数组合分割结果对比如图4.8所示。
图4.8 不同参数组合分割结果对比
(注: ( )中参数的含义为尺度阈值,形状因子,紧致度因子)
由上面的9组数据结果对比发现,光谱因子所占比重越大,分割时考虑光谱特征就越多,所得的对象就越琐碎;而形状因子所占比重越大,分割后所得的对象虽然比较规则,但是由于缺少光谱信息,分割出的对象可能会不属于同一地类,地物信息就不能被有意义地表达。紧致度和光滑度对分割结果的影响没有光谱因子的影响明显,但是从上组图中可以发现,紧致度比重越大,形状规则的对象刻画的就越好;而光滑度越大,所得的多边形对象边缘就较为光滑。
综上所述,不同分割方法各有优劣,在本研究中,主要采用多阈值分割、多尺度分割相结合的分割方法,另外在提取感兴趣区和雷达数据提取技术研究时拟采用分割速度最快的棋盘分割,各种分割方法的分割参数及在本研究中的应用情况见表4.1。
表4.1 分割方法汇总表
2.面向对象影像分类
影像分割完成后就要对分割出的对象进行分类。理论上讲,特定的目标地物总是与一定的特征及其组合相联系,只要合理地选择地物特征及其组合,就能将目标地物和其他地物区别开。基于像元的分类方法中,像元通常只包含有三种信息:光谱值、位置与大小。而面向对象分类方法分割后的对象具有更加丰富的信息,在对象中可提取的特征有:光谱特征、形状特征、纹理特征、拓扑特征等,每一种特征又包括若干指标。其中,光谱特征包括均值、方差、灰度比值等;形状特征包括面积、长度、宽度、边界长度、长宽比、形状因子、密度等;纹理特征包括对象方差、灰度共生矩阵的同质性等。面向对象的影像分类方法可以综合利用对象的多种特征并指定不同权重,建立分类规则对影像分类,进行特征信息的提取。
通常有最近邻法、模糊分类(隶属度函数)、支持向量机(SVM)和决策树等几种面向对象的分类方法。每种方法都有自己的局限性,本研究采用较为灵活的决策树分类方法,构建多种算法融合的分类规则。
由于遥感图像的复杂性和其他因素的影响,很难简单地把图像中的对象归于某一个类别。决策树法是指根据影像的不同特征,以树型结构表示分类或决策集合,产生规则和发现规律。首先利用训练空间实体集生成判别函数;其次根据判别函数的不同取值建立树的分支,在每个分支子集中重复建立下层结点和分支;最后形成决策树。决策树由一个根结点、一系列内部结点和终极结点组成,每个结点只有一个父结点和两个或多个子结点。决策树算法在遥感分类中的应用是依据规则把遥感数据集一级级往下细分作为决策树的各个分支,终极结点则为分类结果。决策树分类模型如图4.9所示。
土地利用分类系统是监测的基础。本研究在总结各个分类系统的基础上,针对高分遥感数据的特点和水土保持业务需求,构建可满足水力侵蚀定量计算的土地利用分类体系以及高分遥感可提取的土地利用分类体系,并确定分类方案。分类方案思路如图4.10所示。
图4.9 决策树分类模型
R—根结点;I—内部结点;T—终结点
在我国常用的土地利用分类系统主要包括全国农业区划委员会制定的土地利用分类系统(全国农业区划委员会,1984)、中国科学院土地利用遥感监测分类系统(刘纪远,1996)和国土资源部制定的国家推荐性标准GB/T 21010—2007 《土地利用现状分类》等三大分类系统。
图4.10 分类方案思路
1.全国农业区划委员会土地利用现状分类
全国农业区划委员会1984年制定了全国统一的《土地利用现状调查技术规程》,制定了两级分类系统,包括耕地、园地、林地、牧草地、居民点及工矿用地、交通用地、水域、未利用地等8个一级类和46个二级类。该分类系统是使用最长的分类系统,之后出现的分类系统基本上是在此分类系统的基础上修改完善。
2.中国科学院土地利用遥感监测分类系统
中国科学院在“八五”重大应用研究项目“国家资源环境遥感宏观调查与动态研究”中制订了土地资源分类系统,是在前者的基础上针对遥感技术特点修改完成的,兼顾了土地利用现状调查和动态监测的双重需要,后来又经过多次的修改完善,形成了中国科学院土地利用遥感监测分类系统,共包括耕地、林地、草地、水域、城乡工矿居民用地、未利用土地等6个一级类、25个二级类和8个耕地三级类。
3.土地利用现状分类国家标准
2007年8月,我国发布第一个国家推荐性标准GB/T 21010—2007 《土地利用现状分类》,采用一级、二级两个层次的分类体系,共分12个一级类、57个二级类。其中一级类包括:耕地、园地、林地、草地、商服用地、工矿仓储用地、住宅用地、公共管理与公共服务用地、特殊用地、交通运输用地、水域及水利设施用地、其他土地。
经研究发现:①全国农业区划委员会制订的土地利用分类系统在近年的相关研究中应用较少;②中国科学院土地利用遥感监测分类系统支持了自1996年开始的全国土地利用遥感监测,包括6期全国1∶10万比例尺土地利用数据库,该分类系统多用于宏观尺度土地利用动态监测的科研工作,在行业应用中体现不多;③土地利用现状分类国家标准更倾向于国土行业的应用,对水土保持行业不完全适用。
各研究领域专家普遍认为人类及其活动是造成土壤侵蚀的主要原因,不合理的土地利用方式和地表植被覆盖的减少对土壤侵蚀具有放大效应(吴秀芹等,2003)。大量的相关研究表明,不同的土地利用类型对水力侵蚀的影响不同,且不同区域、不同时期、不同尺度上土地利用类型对土壤侵蚀的影响程度各不相同(高杨等,2006;赵文武等,2006)。因此,建立水土保持行业自己的土地利用分类体系至关重要。目前,与水土保持相关的土地利用现状分类行业标准主要有两个。
1.SL 449—2009 《水土保持工程初步设计报告编制规程》
根据GB/T 21010—2007 《土地利用现状分类》,结合水土保持工程设计中有关土地利用现状调查和土地利用调整的实际需要,制定土地利用现状分类表(水土保持)。该分类标准在归纳合并了国标一级类、二级类的同时,将园地、林地、草地细化到了三级类,耕地细化到了四级类。
2.SL 592—2012 《水土保持遥感监测技术规范》
规范中指出,在土壤侵蚀分析中将GB/T 21010—2007 《土地利用现状分类》中的“商服用地、工矿仓储用地、住宅用地、公共管理与公共服务用地、特殊用地”等5个一级类以及二级类中的“街巷用地、空闲地”归并为“城镇村及工矿用地”使用,形成适用于水土保持的土地利用现状分类。
两个水土保持行业标准均在国标分类标准的基础上进行类别合并,形成8个一级类。《水土保持工程初步设计报告编制规程》分类粒度更细,更适合于水土保持工程设计需要,水土保持遥感监测技术规范中只是对国标一级类、二级类进行了简单的合并,部分二级类分类过细,仍需要作进一步归纳。
综合以上对现有土地利用分类系统的分析得知,并没有一种完全合适的分类体系适合水土保持高分遥感土地利用类型的提取。本书尚需要根据水力侵蚀定量计算的需求、GF卫星载荷特点、项目研究总体需要,制定水土保持高分遥感土地利用分类方案。
面向水力侵蚀土地利用类型分类体系,一级类框架与现有国标和行标保持一致,二级类进行适当合并和调整,根据示范区水力侵蚀土地利用类型的需求和高分遥感的可提取性,将土地利用类型分为8个一级类和25个二级类,其分类级别见表4.2。
表4.2 水土保持高分遥感土地利用类型与编码
注 1.分类标准依据:GB/T 21010—2007 《土地利用现状分类》、SL 592—2012 《水土保持遥感监测技术规范》、SL 449—2009 《水土保持工程初步设计报告编制规程》。
2.分类原则:①以自然地表覆盖和土地利用相结合为原则;②以高分遥感能够识别的土地利用类型技术具有工程化可行性为原则;③以土地利用类型与其他行业用户提供的国家标准土地利用类型数据能够无缝转换为原则。
1.SLC01耕地
耕地包括SLC011水田和SLC012旱地两个二级类,根据高分遥感可识别性以及耕地图斑的完整性,在国标分类基础上做以下调整:国标二级类中的水田以及水田中的田坎统一合并为水田,国标二级类中的水浇地、旱地、旱地田坎统一合并为旱地。
耕地中的坡耕地是水土保持中最为关注的土地利用类型,是山区水土流失的重要隐患,因此,在耕地二级类基础上还需要进一步细分,将旱地再分为SLC0121 旱平地、SLC0122梯田、SLC0123坡耕地、SLC0124沟川坝地4个三级类。
2.SLC02园地
园地包括SLC021果园、SLC022茶园、SLC023其他园地3个二级类。与国标分类一致。在示范区,主要为果园。
3.SLC03林地
林地包括SLC031有林地、SLC032灌木林地、SLC033其他林地3个二级类,与国标分类一致。
4.SLC04草地
草地包括SLC041天然牧草地、SLC042人工牧草地、SLC043其他草地3个二级类,与国标分类一致。
5.SLC05城镇村及工矿用地
城镇村及工矿用地包括SLC051城镇居民点、SLC052农村居民点、SLC053采矿用地、SLC054其他建筑用地。一级类沿用水土保持行标的分类方法,将国标05、06、07、08、09五个一级类进行合并;二级类根据高分遥感可识别性重新划分,国标中的103街巷用地、104农村道路、121 空闲地并入所在城镇或者农村,122 设施农用地并入所在农村。
6.SLC06交通运输用地
交通运输用地包括SLC061一般交通运输用地、SLC062机场用地。根据交通运输用地的遥感解译特征,将国标分类系统中的铁路用地、公路用地、港口码头用地、管道运输用地合并为一般交通运输用地。在示范区,交通运输用地主要为一般交通运输用地。
7.SLC07水域及水利设施用地
水域及水利设施用地包括SLC071 水面、SLC072 滩涂、SLC073 水利设施用地、SLC074冰川及永久积雪。根据水域及水利设施用地的遥感解译特征,将国标中的河流水面、湖泊水面、水库水面、坑塘水面合并为水面,沿海滩涂、内陆滩涂合并为滩涂、沟渠、水工建筑用地合并为水利设施用地。在示范区,水域及水利设施用地主要为水面和滩涂。
8.SLC08其他土地
其他土地包括SLC081盐碱地、SLC082沼泽地、SLC083沙地、SLC084裸地。将国标分类系统其他土地中的空闲地、设施农用地、田坎拆分到相应类别中后,与剩余地类保持一致。在示范区,其他土地主要为裸地和沙地。
根据GF-1和GF-2卫星载荷特点,对水土保持高分遥感土地利用类型分类方案中的土地利用类型可提取程度进行分析发现,“一级类”提取技术难度适中,有工程化、自动化实现的可行性,“二级类”自动化提取的难度大,在辅助解译数据充分、更多人工干预的情况下可交互提取。因此本研究基于面向对象进行提取的土地利用分类方案主要以水土保持高分遥感土地利用类型分类方案中的“一级类”为主,由于示范区特殊的地理位置,有大片的沙地和裸地存在,因此将这两类用地类型进行重点算法提取,其余“二级类”主要以人工目视解译为主,目视解译部分本书不做重点阐述。