基于各类声学图像的水下底质分类是近年来研究的热点,这一方面得益于相关硬件、软件的逐渐丰富;另一方面得益于相关理论和方法的发展进步。基于单一类型声学图像的水下底质分类目前已积累了一些研究成果,根据数据源不同可分为基于侧扫声呐图像、基于多波束反向散射强度和测深数据以及基于浅地层剖面图像的分类研究。随着研究的深入和实践经验的丰富,一些研究已经提出了多源声学数据融合的思想,结合多种声学数据进行底质分类或水底目标识别已在一些应用中得到了实践,但仍以人工综合判读为主,信息融合的层次较低。
侧扫声呐图像是一种水底地貌图像,基于侧扫声呐图像的底质分类主要利用不同底质在图像中的灰度和纹理信息,可用于识别一些特定的底质大类如岩石、砾石、砂、泥等。有关研究主要围绕三方面开展,一是研究适用于侧扫声呐图像底质分类的灰度和纹理特征量;二是在此基础上研究用于底质分类的自动分类算法;三是直接采用人工识别方法或使用商业软件进行底质分类。
侧扫声呐图像的灰度特征主要通过灰度直方图统计量进行描述,常用的特征量包括均值、标准差、偏度、峰度、能量、熵、变异系数、灰度直方图的分位数、极差等参数 [16-23] 。侧扫声呐图像的纹理特征常被作为判别水下底质类型的重要特征描述量。王雷 [24] 、李庆武等 [25] 总结了目前常用的纹理信息提取方法并划分为4类:统计分析法、结构分析法、频谱分析法以及模型分析法。其中,统计分析法包括灰度共生矩阵法 [22—23][26] 、高阶统计量法 [27] 、分形几何法 [24][28—30] 等;结构分析法包括形态学分解 [31] 、拓扑纹理描述 [32] 等;频谱分析法包括小波分析法 [33-35] 、傅里叶谱分析法 [21][36-37] 、纹理能量法 [38] 等;模型分析法常用模型包括马尔可夫模型 [24][39-41] 、Tamura模型 [42] 、Gabor滤波器模型 [24][43—44] 等。虽然上述几类可概括目前常见的大部分声学图像纹理信息提取方法,但根据特征量的构造方法和统计指标不同,还可对上述方法再做细分 [24][45-46] 。例如,采用梯度算子(如Roberts算子、Sobel算子等)对图像进行变换并计算灰度共生矩阵统计量,形成了灰度—梯度共生矩阵法 [46] ;考虑原图像中各像素与其邻域内所有像素的灰度值联合分布,形成了邻域灰度共生矩阵 [24] 。常用的灰度共生矩阵(Gray Level Co—occurrence Matrix,GLCM)纹理描述方法还可导出多个统计指标,Haralick等 [26] 首次提出14个基于GLCM的统计指标(Haralick等,1973);在国内外水底声学图像分类相关研究中常用的包括角二阶矩、对比度/反差度、相关系数、方差、逆差矩/惯性矩、熵等 [21][23][47—48] 。
目前提出的侧扫声呐图像特征描述量已非常丰富,但是实际应用中往往根据特征提取方法的可实现性主观选择用于图像分类的特征量,一些研究甚至认为提取的特征量越多越好。实际上,很多特征量具有高度相关性,也并非所有特征都有助于侧扫声呐图像分类,根据具体数据怎样合理地进行特征选择仍需要进一步研究。
侧扫声呐图像自动分类算法的研究中,李庆武等 [49] 基于Contourlet变换后的纹理特征,应用支持向量机算法对图像大小为64×64的5种典型底质侧扫声呐样本图像进行分类(李庆武等,2011);熊明宽等 [16-17] 基于灰度和纹理共6种特征量,分别应用支持向量机、遗传小波神经网络等算法对泥、砂、礁石 3 种底质的典型样本图像进行了分类研究(熊明宽等,2012、2014);杨词银等 [38][50] 基于纹理能量特征、邻域灰度共生矩阵特征,应用K—均值聚类算法和三层BP神经网络分类算法对大小为64×64的泥、砂、石3种底质的典型样本图像进行分类(杨词银等,2005);胡玉薇 [30] 研究了水下声学图像的分形维数特征,应用二层BP神经网络算法对沙土与石块、水下沙层波纹、多年变形冰层3种类别、大小为48×48的声学图像样本进行了分类研究(胡玉薇,2009);郭军等 [51-52] 基于灰度均值和共生矩阵统计量共7种特征,应用支持向量机算法对泥土、沙地、岩石、沙砾、泥沙5种底质、大小为32×32的典型样本图像进行分类(郭军等,2012、2016)。上述对侧扫声呐图像自动分类算法的研究均采用尺度较小的局部样本图像,由于样本图像中的底质类别单一,纹理特征明显,因此可达到较好的分类效果,但在实际应用中往往难以提取出形状规则且纹理单一的底质分布区,故上述方法无法直接用于底质分布复杂、覆盖区域较大的声学图像分类。
一些国外研究尝试了仅使用侧扫声呐图像进行大范围底质分类,Fournier等 [53] 基于侧扫声呐图像的灰度特征进行K—均值算法分类,但结果仅能描述某些水底植被的大致空间分布情况(Fournier等,2010);Lucieer [54] 基于侧扫声呐图像的均值、标准差和灰度共生矩阵的均值共3种特征,采用面向对象方法和最近邻算法研究了澳大利亚某海域的底质分布,该研究只将底质分为砂(Sand)和礁石(Reef)两类或砂、礁石和低矮礁石(Low Reef)3类,即发现当所分类别数增加时,分类精度大幅下降(Lucieer,2008)。上述研究表明,仅使用侧扫声呐图像进行大范围底质分类时,图像提供的信息十分有限,若不充分利用图像的灰度和纹理信息,不仅结果的分类精度低,而且不适用于多类别底质的分类,现有分类方法的泛化能力仍有待提高。
侧扫声呐图像具有较高的空间分辨率,因此常被用于人工底质分类。沈蔚等 [55] 对C3D测深侧扫声呐系统进行了研究,认为基于高清晰的水下声呐图像一般可以通过人工方式准确区分沙地、泥地、碎石、礁石等不同的水底地貌(沈蔚等,2013);王志光等 [56] 讨论了基于侧扫声呐人工判别水下洼地和水下障碍物的方法(王志光等,2012);Kaeser等 [57] 通过人工解译方法对美国Flint河某段的水下沙、细砾石、粗砾石、细石灰石、石灰石块、混合砾石等底质进行分类(Kaeser等,2013);Lucieer [54] 对比了侧扫声呐图像自动分类结果与人工解译结果,发现人工识别多类底质时结果精度明显高于自动分类(Lu cieer,2008);Gutperlet等 [58] 研究了侧扫声呐图像人工解译结果与真实底质粒径的关系,结合取样调查数据发现在轻微人类扰动的环境中,人工解译结果可较好地与底质粒径匹配,在扰动较大的环境中,由于反向散射强度受到地表粗糙度的影响,人工解译结果与底质粒径的相关性减弱但仍然显著(Gutperlet等,2017)。
除了国内外大量研究和实践中采用的人工判读方法进行水下底质分类,目前侧扫声呐的自动分类的软件已经在国外得到了商业推广,挪威Simrad公司的Triton分类软件基于反向散射强度的特征参数进行分类;加拿大QTC公司的Multiview软件基于反射波束的波形特征进行分类,可提取超过 166 个波形特征或描述符 [59] ;英国Echoplus公司的ECHOplus系统基于声波的两次反向散射信号反演水底粗糙度和硬度实现底质分类;英国GeoAcoustics公司的Texture Mapping System可基于图像纹理进行底质分类。上述研究表明,通过人工解译方法对侧扫声呐图像进行底质分类是一种较为可靠的方法,而且与自动分类方法相比其对图像的预处理要求更低,但是此类方法处理海量数据时工作量很大且判读过程常常不可回溯。虽然目前已有对侧扫声呐图像的自动分类软件相关应用的报导,均未将软件自动分类结果直接作为底质空间分布的标准,可见其底质分类精度还有待验证。此外,一些进口软件的封闭性也限制了对底质分类精度的改进。
多波束系统通过对每个接收波束进行幅度时间序列采样(或称为Snippet技术),不仅可得到水底地形图,还可得到水底地貌图像,由于测量时能够准确测定波束的入射角,多波束系统生成的图像具有较高的位置精度。基于多波束图像的底质分类研究主要围绕3方面开展,一是利用精确校正得到的与入射角无关的反向散射强度图像进行底质分类;二是利用未经入射角校正的反向散射强度数据和入射角信息建立与底质类别的关系;三是结合多波束反向散射强度和测深数据进行底质或水底目标识别。
如上所述,侧扫声呐获取的水底地貌图像与多波束系统获取的反向散射强度图像具有相似性,因此两类数据的特征提取和分类方法一般可以通用。一些研究专门基于多波束反向散射强度数据进行了底质分类方法研究,阳凡林 [21] 研究了BP网络监督分类、SOM网络非监督分类和基于最小概率的Bayesian分类等底质分类方法(阳凡林,2003);唐秋华等 [60] 介绍了基于自组织特征映射(Self—organizing Feature Map,SOFM)对多波束图像进行底质分类的方法(唐秋华等,2004);吕海龙等 [61] 基于反向散射强度、频谱分布和GLCM的对比度等特征,研究了贝叶斯分类方法在多波束图像底质分类中的应用(吕海龙等,2006);赵旭 [62] 基于多波束反向散射强度数据提出了一种使用FuzzyART神经网络的水底沉积物分类方法(赵旭,2009);Brown等 [63] 使用Multiview软件对多波束反向散射强度数据分类,实现了表层底质分布制图,但分类结果受到水底地形的影响(Brown等,2011)。上述研究表明,只有在地形起伏较小的地区,多波束系统才能得到与入射角无关的反向散射强度图像并可直接用于底质分类;而在水底存在起伏的区域,多波束反向散射强度往往仍受到水底微地形的影响,分类时必须有效利用图像灰度和纹理特征才可能改善精度。
多波束系统通过斜入射的方式可获得底质多角度入射的反向散射强度数据,通过大量实验建立波束入射角、声波频率、反向散射强度和底质类别的关系模型或数据库对基于多波束系统的底质分类具有重要意义。赵建虎 [64] 等讨论了不同掠射角、不同频率与不同底质类型组合时多波束反向散射强度的特征(赵建虎等,2008);金绍华等 [65—66] 研究了基岩、砂、泥粉砂质砂、淤泥质粉砂、砂淤泥质粉砂等几类底质的反向散射强度随入射角的变化关系(金绍华,2011、2014);何林帮等 [67] 通过实验比较了砾石、砂、淤泥3类底质与波束入射角和多波束反向散射强度的关系(何林帮等,2014);Zhi等 [68] 讨论了在同一入射角下,泥、砂、砾石3类底质的含量与反向散射强度的关系(Zhi等,2014)。上述研究经过大量测量建立了反向散射强度、入射角与底质类别的关系,但对于水底地形和底质类别未知的区域,上述方法仍有局限性。
多波束反向散射强度与测深数据的结合为底质分类提供了更多可用信息,Marsh等 [69] 基于以上两类数据提出用自组织神经网络进行底质分类的方法(Marsh等,2009);Micallef等 [70] 利用以上两类数据将水底地貌和地形分别分类,并使用TexAn软件和监督分类方法进行半自动的水底生境分类(Micallef等,2012);Diesing等 [71] 基于以上两类数据及其衍生数据,将地统计学方法、面向对象分类方法和随机森林算法的底质分类结果与人工综合解译结果比较,发现面向对象方法的分类结果与解译结果更为接近(Diesing等,2014)。通过人工判别方式结合多波束反向散射强度和测深数据识别水底目标是较为常见的应用方式,丁继胜等 [72] 介绍了利用多波束反向散射强度、测深和水体数据识别水底目标的方法(丁继胜等,2014);陈正荣等 [73] 利用多波束采集软件EIVA的点云图和DEM三维图进行水下的沉船和集装箱的人工识别(陈正荣等,2013);黄承义等 [74] 利用多波束生成的水下三维地形对海底管道进行人工识别(黄承义等,2013);陆俊 [75] 用多波束系统和Cfloor软件生成水下地形图,用于水下潜坝、沉船的探测和泥沙推移的研究(陆俊,2006)。上述研究表明,随着多波束系统的测深精度和分辨率提高,结合多波束反向散射强度和测深数据进行水下底质分类还有很大潜力,虽然两者结合的人工判别已经较为常用,但结合两类数据进行自动底质分类的方法还缺少更为系统的研究。
此外,以上介绍的商用底质分类软件,如Triton、Multiview以及英国的RoxAnn系统、美国的ASCS和VBT—Bottom Classifier系统等都能对多波束数据进行特征提取、特征训练和分类,但仍存在分类精度不高、分类级别不够多、对于混合像元或不同底质类型的边界区很难区分等问题 [76] ,有时必须结合现场取样等其他辅助方法才能更有效、稳健地应用 [77] 。
国内关于浅地层剖面仪的相关文献主要集中于对其基本原理的介绍 [78—79] 、与侧扫声呐和多波束等数据的集成 [80] 、浅地层剖面数据表达方式 [81] 等的研究,应用于水底分层DTM的生成 [82] 和水底目标探测 [83] 等领域,且大多基于人工识别方法,目前国内还未见基于浅地层剖面图像的底质自动分类方法研究。国外已有文献利用浅地层剖面仪所获取的剖面声学图像进行底质分类的研究与应用,Stevenson等 [84] 研究了浅剖信号衰减量与底质粒度的关系(Stevensen等,2002);Zheng等 [85] 尝试利用浅剖数据反演底质的孔隙率(Porosity)和渗透率(Permeability),从而用这两个特征进行底质分类(Zheng等,2013);Nitsche等 [86] 综合应用侧扫声呐和浅地层剖面仪数据,分析了美国Hudson河床底质的类型,并发现底质的反向散射强度由体散射、底质粒度和河床表面粗糙度等多个因素决定(Nitsche等,2004),采用类似方法进行底质及地层识别的还有Schrottke等 [87] 和Lowag等 [88] 。因此,基于浅地层剖面图像的表层底质自动分类方法还有待进一步研究。
浅地层剖面图像主要反映两类水底特性,一是水底地形起伏,据此可判断是否有突出于平均水底面的特殊地物;二是水底剖面的声阻抗特性,据此可区分其扫描的正下方区域底质类型及其变化。浅地层剖面图像可为基于侧扫声呐和多波束系统图像的水下底质分类提供更多的参考信息,既可作为水底自动分类的依据,也可作为分类结果的验证数据。
如1.1.3小节所述,侧扫声呐以获取具有较高分辨率的水底地貌图像为主,多波束系统可获得水底反向散射强度形成的地貌图像和通过测深结果形成的水底地形图,浅地层剖面仪可获得垂直测线的浅地层剖面图像,三种数据具有多源、多维、异构的特征,两两结合将有相得益彰的效果。因此,多源声学图像融合的思想早已被提出,并在一些研究中得到了实践。目前对多源声学图像信息融合的研究可分为自动(或半自动)融合和人工综合应用两方面。
多源声学图像信息自动融合是建立在多源信息融合理论上的。实现多源声学图像信息自动融合的基础是将这些数据进行有效集成。姜小俊等 [83] 采用GIS空间数据管理技术,提出了基于THB—SFBAO的水底浅层声学数据集成与融合模型,可实现多源声学数据集成与综合应用(姜小俊,2008);任少华等 [80] 提出了一种基于特征和应用(Feature and Application,F—A)的水底声学数据融合方法:首先基于主题进行数据集成,然后根据相关特征和应用进行数据融合,最终实现面向应用的数据高效管理和有效融合(任少华等,2009);刘长东 [89] 研究了基于水下多源数据的海域管理信息系统,在集成多源、异构数据的基础上提供了空间分析、业务管理、模型演示等数据综合分析功能(刘长东,2008);李鹏 [90] 研究了面向底质勘察的多源、异构数据集成技术(李鹏,2013);Parrott等 [91] 介绍了一种集成多波束测深数据和侧扫声呐图像的方法,其主要思想是将多源数据分别预处理转换为栅格数据,再通过GIS系统统一地理坐标,最终实现多源数据的集成和综合应用(Parrott等,1999);Ware等 [92] 开发的GeoZui3D系统可集成多源水下探测数据,并基于统一的空间参考实现水底表层的实时监测、目标解译和目标定位(Ware等,2001)。上述文献以多源声学数据的集成框架研究为主,而未对多源声学信息融合后的具体应用进行技术框架的讨论。
多源声学图像信息自动融合更重要的目的是通过融合获取更高质量的图像数据或有用信息。国内外一些研究由此借鉴了多源遥感图像融合的概念和方法。Bas等 [93] 介绍了一种融合侧扫声呐和多波束测深图像的方法,主要实现两种数据的精确配准,使合成的数据具有较高的空间分辨率和三维位置精度(Bas等,1997);Huang等 [94] 研究了侧扫声呐图像自身的特征级和决策级方法,其特征级融合将灰度共生矩阵、游程矩阵、小波变换、Gabor滤波等几类特征作为融合对象输入多层感知分类器(Multilayer Perceptron Classi fier)用于图像分类,其决策级融合应用了多数投票法(Major Voting)、模糊隶属度(Fuzzy Membership)方法和证据理论(Evidence Theory)3类方法,结果表明基于证据理论的决策级融合对侧扫声呐图像自身信息融合最为有效(Huang等,2006);Reed等 [95] 研究了侧扫声呐图像自身的决策级融合方法,分别比较了基于马尔可夫随机场(Markov Random Field,MRF)和基于可能性理论(Probabilistic Theory)的融合方法(Reed等,2006);Noel等 [96] 结合侧扫声呐、干涉式测深侧扫声呐、科学回声探测仪以及视频摄像机等多源数据,采用DIVA (Detection & Investigation Vertical Acoustic)方法融合多源数据得到水底植被分布图,但该方法需要较多人工参与(Noel等,2008);Ismail等 [97] 提取了多波束测深数据多个尺度的特征量,并结合侧扫声呐数据采用主成分分析(Principal Component Analysis,PCA)和K均值聚类(K-means clustering)方法进行水底地貌分类(Ismail等,2015);Lucieer等 [22][98] 使用多波束反向散射强度、测深数据及其衍生数据,并结合自主式水下潜航器(Autonomous Underwater Vehicle,AUV)等辅助数据分别对澳大利亚和新西兰两处海域开展了底质自动分类研究
(Lucieer等,2011、2013)。国内的相关研究主要有:阳凡林等 [21][99] 在实现侧扫声呐和多波束测深数据配准的基础上提出了一种基于二进小波的融合方法,得到了保留多波束和侧扫声呐数据大多数信息的融合图像(阳凡林等,2003、2006);郭军 [100] 提出了基于SURF (Speeded Up Robust Features)的声呐图像自动配准方法,并采用加权融合法实现多波束与侧扫声呐图像的融合(郭军,2013);赵建虎等 [101] 改进了SURF匹配算法,通过两类数据的图像配准后融合,同时获取了高质量的水底地形和地貌数据(赵建虎等,2013);汤春瑞 [102] 提出了基于Retinex模型分解和Surfacelet变换进行侧扫声呐和多波束图像融合的方法(汤春瑞,2009);王达等 [103] 基于Piella多尺度分解框架提出了一种多源声呐图像的像素级融合方法(王达等,2015)。从上述研究来看,国内研究主要集中于在数据层面融合多源声学图像以改善数据质量,国外研究虽然提出了一些对水底地貌、地形数据的特征级融合方法和对地貌数据自身的决策级融合方法,但目前仍缺乏多源声学数据特征级和决策级融合的统一技术框架,对于浅地层剖面数据提供的信息也未在自动融合过程中充分利用。
通过人工综合判读的方式对侧扫声呐、多波束和浅地层剖面等多源声学数据进行水下调查与底质分类已经在国内外水下调查工作中得到了广泛的应用,例如刘晓东等 [104] 、彭俊等 [105] 、刘乐军等 [106] 、林曼曼 [107] 结合多源声学数据进行了水底地质灾害类型的人工判别;姜小俊 [108] 、Ruffell [109] 、Tian [110] 等结合多源声学数据进行了水下目标物的声学探查;Georgiadis等 [111] 、Shumchenia等 [112] 的研究中利用多源声学数据进行了海底生境的调查。通过人工方式综合多源声学信息虽然已成为被普遍认可并广泛应用的方法,但以这种方式为主的信息融合工作量巨大,也亟须自动或半自动融合方法作为补充或替代。