人类从诞生之日起,就在不断地利用各种方式对地形进行表述。由于知识有限,最初只能进行一些定性的描述,例如,通过绘画表示山地的连绵起伏,通过文字记述地表存在的某种现象。17世纪以后,人类逐步意识到地形起伏对环境的其他影响,开始出现透视写景图、晕滃法、地貌写景图、地貌单元图等各种方法来描述地表情况。随着社会的发展,18世纪开始出现了以等高线为主要特征的地形图,可以更加直观、准确地对部分地形特征进行定量分析,地形起伏的描述通过正交投影在水平面上、相邻高程相等的点连接而成的闭合曲线来表示。20世纪40年代,计算机的出现使所有领域发生了巨大的革命,借助计算机进行数字形式的地形表达成为制图领域乃至整个测绘领域研究的主要问题,在这种背景下,数字高程模型应运而生。
1956年,美国麻省理工学院的Miller教授在解决道路计算机辅助设计时引入了数字地形模型(Digital Terrain Model,DTM)的概念。在更普遍的意义上,数字地形模型包含了地貌信息、基本地物信息、自然资源与环境信息、主要的社会经济信息四项内容。当所要表示的内容只有高程信息时,数字地形模型就变成数字高程模型(Digital Elevation Model,DEM)。简而言之,数字高程模型是按照空间坐标将各个位置的高程信息以数字形式组织在一起的空间分布模型,并模拟真实的地貌信息,是地形形状大小和起伏特征的数学描述。
自DEM概念提出以来,许多学者在不同的时期都对DEM进行过定义,而不同机构和地区所采用的术语也不太一致(见表1.1)。在术语的表达上,虽然词义比较接近(例如,Elevation和Height为同义词,Ground和Terrain为近义词),但含义并不完全相同,代表不同特色的地形数字化产品。各种定义在表述上虽有差异,但基本观点都是一致的,即从模型和结果呈现形式的角度出发讨论DEM的概念。
表1.1 数字高程模型有关术语
DEM的出现标志着地形表达从模拟时代进入数字时代,之后科技人员对其进行的研究几十年来方兴未艾,在地理信息技术和空间数据知识发现中应用广泛,图1.1是DEM在三维地形仿真和水域模拟分析中的应用。在地形分析中,DEM提供基础支撑数据,可用于地形特征的提取、地形简化、坡度计算、剖面图显示等;在工程应用中,DEM可用于工程挖填方的计算、道路勘测、土方量计算等;在防震减灾中,基于DEM可以进行泥石流水动力分析、雨水汇水面积分析、数字河网构建等;在军事应用中,DEM可以为虚拟战场提供地形显示数据,为武器精确制导进行地形匹配等;同时,DEM被广泛应用于遥感、通信、林牧业等国民经济的各个领域。
国际摄影测量与遥感学会一直将DEM作为一个重要主题,组织相关工作组进行国际性合作研究。作为空间定位的数学集合,DEM数据的应用几乎可以涉及整个地学领域,要进行地理空间定位的研究,一般首先需要建立数字高程模型。在DEM的基础上叠加相关属性信息还可以形成不同的DTM数据,保障不同用户的需求。
图1.1 DEM在不同领域的应用
地理空间实质上是一种三维空间,在二维空间很难准确描述。DEM数据的主要目的是将源域(实际地形)转换到另一种空间域(数字高程模型)上,通过对其进行简化抽象,将研究对象从实地转移到数据模型上,完成三维空间到二维空间的转变。DEM是通过空间定位对一定区域内的高程特征进行的数字描述,其数学表达式可以简化为
其中, V i 表示区域 D 中 n 个高程点中的一个元素, X i 和 Y i 分别代表该点的平面横坐标和纵坐标(平面定位坐标), Z i 表示该点的高程值。本质上,数字高程模型表示的就是该区域上的一个三维向量有限序列。根据序列中平面坐标的组织形式不同,可以将其分为不同类型。当平面位置排列规则时,对于任意序数 i ,有
则该三维向量有限序列表示的是规则格网DEM数据,其坐标数据可以省略。通过记录其空间范围、格网间距及对应每个格网点的高程矩阵,可以推断出所有格网点的平面坐标和高程信息;若平面坐标相互间不存在这种关系,坐标分布没有特定规律,平面坐标与高程值一一对应,则该三维向量有限序列表示的是不规则DEM数据,包括不规则三角网DEM、等高线模型、离散点模型及断面线模型等类型。其中,规则格网DEM和不规则三角网DEM是两种最常见的数字高程模型,也是本书研究的主要对象。
规则格网数字高程模型(Regular Square Grids DEM,RSG DEM)简称规则格网DEM,是将DEM建模区域的最小外接矩形,在纵、横方向上等间隔进行划分,划分成若干个间隔相等、形状相似的格网单元;按规定顺序(如逐行或逐列)记录每一个格网点(格网单元)的高程值,而格网点的平面坐标信息可通过格网行、列号求解得到,如图1.2所示。
图1.2 规则格网数字高程模型
规则格网DEM的数据组织形式简单,非常便于用计算机存储处理,是目前应用最广泛的一种数字高程模型。图1.3为我国国家标准《地理空间数据交换格式》(GB/T 17798—2007)中定义的格网数据交换格式(.grd;有简化)。
由于无条件记录了空间范围内所有规定格网点的高程信息而造成的大量数据冗余,可采用数据压缩方法进行处理,如行程编码法、块状编码法、四叉树法等。同时,粗略的格网大小难以精确表示部分微小地形的起伏特征,因此规则格网DEM不能描述局部细节信息,与地形表面特征会有所差异。例如,不改变格网大小,无法适用于不同起伏特征的地区。事实上,规则格网DEM数据的主要生成方法最终几乎都可以归结为基于离散采样点的数据建模,其主要思路是:首先,将建模区域进行平面划分,分成规则格网,形成覆盖整个地形建模区域的格网空间;然后,根据分布在周围的地形采样点计算格网点的高程,将其以规定的数据格式输出,完成实际地形特征到数字描述的转变。目前,格网点的高程值具有两种解释:一种认为仅代表格网点本身(也有认为是格网中心点)的高程值;另一种认为是格网内所有高程的平均值。在整个过程中,数据内插算法是建模的关键,目前常用的插值算法很多,主要有线性内插、样条函数内插、曲面叠加内插、最小二乘匹配及有限元内插等。在实际应用中需要根据数据的具体要求选择合适的内插算法。
图1.3 我国格网数据交换格式(有简化)
不规则三角网数字高程模型(Triangulated Irregular NetworksDEM,TINDEM)简称不规则三角网DEM,是从不规则采样点生成连续三角面逼近地形特征的一种数字形式,如图1.4所示。TINDEM是根据地形表面本身特征进行的建模,可以较为详细地表达地形的局部特征,模型的复杂程度一般和地形的复杂程度成正比,用较多的格网点表示地形复杂地区,用较少的格网点表示地形平坦地区。
图1.4 不规则三角网数字高程模型
与规则格网DEM数据相比,TIN DEM可以用较少的点表达相当精度的地形模型,大幅度减少了数据量,克服了高程矩阵存在的数据冗余问题。但由于形成的三角面、点、边之间的拓扑关系复杂,处理过程烦琐,很大程度上影响了其推广和应用。
在TIN DEM数据结构中,基本的数据元素为顶点(采样点)、边和三角形。它们之间存在着点与线、点与面、线与面、面与面等拓扑关系。理论上,通过组成三角形的三个顶点可完整地表达三角形的构成,以及三角形顶点、三角形边、三角形之间的拓扑关系,只需要两种数据结构即可表达这些拓扑关系:三角形顶点坐标结构体、三角形结构体(见图1.5)。这种结构虽然简单,但三角形结构元素的拓扑关系却是隐含的,不利于TIN DEM模型的检索与应用。因此,围绕三角形的拓扑关系描述产生了多种TIN的数据结构,如TIN的点结构、边结构、面结构、点-面结构、边-面结构。
TIN数据的主要建模方法是基于Delaunay三角网进行的,并且根据地形约束条件,可以详尽表示地理空间实际存在的部分特征线。Delaunay三角网的生成算法主要可以分为三类:分治算法、逐点插入法和三角网生成法。其中后两种算法还可用于约束三角网的生成。
图1.5 TIN数据结构示例