除了野外直接采集考古和文化遗产的空间信息之外,我们还可以充分利用已有的地图资料。由于社会生产和生活的多方需求,世界各国的政府、军事、科研等部门已经进行了大量的地图测绘和地理数据的收集工作,并存有丰富的地图资料。这些地图资料既包括各种形式的数字地图,也包括各种类型的纸质地图,其中一些地图资料由于涉及国家安全而无法获取,但也有很多资料对公众开放,甚至可以免费直接从互联网下载。
一般情况下由世界各国的专门机构负责管理这些地图资料,如美国地质勘探局(United States Geological Survey,简称USGS,www.usgs.gov)、英国地形测量局(UK Ordnance Survey,www.ukordnancesurvey.co.uk)、中国国家测绘地理信息局(www.sbsm.gov.cn)等等。我们除了可以从这些机构购买所需地图资料之外,还可以从它们的网站下载一些免费资料,其中数字地图主要有四种类型:数字线划地图、数字栅格地图、数字正摄影像图和数字高程模型(文本框2-2)。
文本框2-2 数字地图的种类
数字线划地图(DLG,Digital Line Graphic)是一种包含各种地图要素的矢量数据集,且保存各要素间的空间关系和相关的属性信息。数字线划地图是现代野外测绘的直接成果。
数字栅格地图(DRG,Digital Raster Graphic)是根据现有纸质、胶片等地形图经扫描和几何纠正及色彩校正后,形成在内容、几何精度和色彩上与地形图保持一致的栅格数据集。
数字正射影像图(DOM,DigitalOrthophoto Map)是对遥感影像进行数字纠正和镶嵌,按一定图幅范围裁剪生成的数字正射影像集。数字正摄影像图是同时具有地图几何精度和影像特征的图像。
数字高程模型(DEM,Digital Elevation Model)是用一组有序数值阵列形式表示地面高程的一种实体地面模型。测绘部门常利用遥感影像的立体像对生成数字高程模型,是遥感影像的派生产品。
无论是何种形式的测绘地图资料,在使用时都需要注意以下内容:
1.坐标系统。任何地图都按一定的坐标系统绘制,因此在获取地图资料时首先要搞清楚地图所使用的坐标系统,而要使用不同坐标系统的地图,就需要对它们进行转换。有关这部分内容已经在第一章中进行了详述。
2.比例尺和分辨率。任何地图都按照一定的比例绘制,因此获取地图资料还要搞清楚地图的比例尺。我们要根据研究的需要确定所需比例尺,并非比例尺越大越好。比如,区域考古研究一般1∶50 000比例尺地图的信息量已经足够了,而针对单个考古遗址的空间分析至少需要1∶10 000比例尺的地图。对于数字栅格图来说还需要了解栅格的大小,即栅格图的分辨率。栅格图的分辨率也并非越高越好,因为分辨率越高,所占计算机内存越多,处理起来花费的时间也越多。
3.地图质量。地图绘制的质量直接影响到我们以此为基础进行空间分析的结论,因此在获取地图资料时要对地图质量进行评估。地图质量既包括地图测绘的精度、地理要素描绘的准确程度,也包括数据采集制作的质量,比如矢量图的图形是否完整、拓扑关系是否准确,栅格图的印刷是否合格,扫描是否清晰等。
4.地理数据采集、分类和处理的方式。地理数据的采集、分类和处理方式不同会导致不同的地图资料之间难以进行整合,比如:以点的方式和以网格的方式记录的人口密度图就不能相互兼容使用;记录现代土壤分类状况的土壤图反映的是现代农耕的结果,不能用来研究古代农业活动;利用等高线以空间插值的方法生成的数字高程模型不可避免地会存在一些人工性误差,从而严重影响我们进行景观分析的结论(详见本书第四章)。因此,在获取地图资料时,必须要了解其中地理数据的采集、分类和处理的方式。
世界各国的测绘机构所提供的数字地图有各种压缩和存储格式,一般的GIS软件都有工具包可以对这些数据进行解压和读取,其中常用的格式如表2-1所示:
表2-1 常用测绘数据的数字格式
在上述数据资料中,矢量图除了包含大量的空间图形之外,还附有丰富的属性信息,使用起来更加方便。栅格图则常常包含全要素信息,使用起来很不方便,因此对于全要素的数字栅格图的使用,通常要将其中不同类型的信息分别提取出来,并转化为矢量格式,这个转化过程称为矢量化。
一般的GIS软件都提供用于矢量化的程序包,比如ArcGIS软件系统的ArcScan模块。一些专门用于空间数据处理的软件,如R2V、Geoway等,则提供了更为强大的矢量化功能。除此之外,一些计算机辅助绘图软件也可以用来实现地图的矢量化工作,比如AutoCAD。无论是采用哪种软件,地图矢量化的工作步骤是一致的,都包括地图扫描和栅格分类增强处理、坐标配准、图形绘制、检查错误和构建拓扑关系、输入属性信息五个步骤。
如果是纸质的地图,那么首先要做的是对地图进行扫描,生成数字栅格图。扫描时要尽量做到将地图展平,以减少由于图纸不平带来的几何误差。应当尽量采用较高的扫描分辨率,以方便矢量化追踪。如果是彩色的全要素地图,扫描后还应该利用图像处理软件,如photoshop等,对不同地理要素进行分类提取,并分图层进行增强处理。比如,彩色全要素地图中等高线为褐色、河流为蓝色、房屋为黑色,那么我们就可以按照不同的颜色分别将其提取出来作为不同的图层,同时对相同的颜色进行色彩增强,以便于后期的矢量化(图2-3)。
图2-3a 全要素地图
图2-3b 利用Photoshop提取并增强的等高线
为了将经过扫描的数字栅格地图置于正确的地理坐标系统中,在矢量化之前还需要对其进行地理坐标的配准,也就是将地图的栅格坐标与真实世界中的地理坐标进行对应。坐标配准的过程是在数字栅格图上,将若干已知地理坐标点的地理坐标与该点的栅格坐标之间建立连接,并以此为基础建立两个坐标系统之间的数学转换关系,从而可以方便地计算出栅格图中任何一点的真实地理坐标,而这些已知地理坐标的点称为地面控制点(Ground Control Points: GCPs)(图2-4)。
图2-4 地图坐标配准
理论上,我们至少需要3个地面控制点才可以完成一幅栅格地图的坐标配准,且控制点数量越多,配准结果越准确。但如果超过9个控制点,那么也会产生大量的冗余信息。在实际应用中,最重要的是控制点的分布状况,而一般情况下相对均匀分布的控制点比集中在一个或几个区域分布的控制点的配准效果要好。我们还可以利用坐标配准过程中的误差均方根参数RMSE来评估配准的整体效果。
我们知道坐标配准中栅格坐标系和地理坐标系之间形成多项式方程的数学关系,因此对于任何一个控制点来说都存在坐标的理论值与实际值之间的误差,而误差均方根参数RMSE代表了所有控制点的误差水平,即理论模型的拟合优度(goodness-of-fit)。RMSE的计算公式为:
其中, X o和 X t分别代表了控制点的真实坐标值和理论坐标值,n为控制点的个数。实践中,究竟RMSE值为多大才能满足坐标配准的精度要求?这要根据地图的比例尺和地图使用的具体方法而定,但就一般情况来说,RMSE值以不大于1∶3000为宜。比如,比例尺为1∶15 000的地图,RMSE值小于5才能满足坐标配准的基本要求(15 000/3000=5)。如果计算所得的RMSE值大于所需的最低值,那么我们就要考虑删除一些RMSE值较大的控制点来重新拟合坐标配准模型。
在配准了坐标的栅格图上可以进行图形的绘制,提取我们所需的矢量信息。在矢量化软件中绘制矢量图形有两种方法:手工追踪和自动追踪。手工追踪是手动确定点、线和面要素的各个顶点(vertices)空间位置的图形绘制方法;自动追踪则是由计算机根据相邻栅格数值的近似程度自动追踪确定点、线、面要素各顶点的空间位置。
一般情况下,与自动追踪的方法相比,手工追踪绘制矢量图形有更多好处,最主要的是可以人工确定矢量图形重要顶点的位置,减少产生冗余顶点的数量,而这在控制文件大小和后期利用矢量图进行插值时会大有益处。比如,利用等高线插值生成DEM或TINs,手工绘制的等高线往往比自动追踪的效果更理想,产生的冗余信息更少。
自动追踪模式按照用户预设的参数等距离绘制图形顶点,与手动追踪相比速度更快,但同时也会产生大量的冗余信息。解决的方法是,一般软件会有自动追踪的顶点清除功能(cleanup),按照两点确定一条直线的原则,清除同一直线上两点之间多余的顶点(图2-5)。
图2-5 地图自动矢量化
值得注意的是,采用自动追踪加顶点清除模式矢量化可以在后期用于对一些地表景观特征的分析上。比如,如果我们按照统一的参数,采用自动追踪的模式绘制等高线,然后再按照统一的参数进行顶点清除,那么利用最终构成这些等高线的顶点插值生成的密度图则反映了一定范围内地表水平曲率的变化(彩图2-6)。
初步绘制完矢量图形之后还要检查图形的各顶点定义是否有误以及图形之间的拓扑关系是否正确。对于线性要素而言,如果同一条线段分多次绘制,那么要检查它们之间的顶点是否正确相连。如图2-7所示代表了两种常见的错误:相离和相交。同样,对于多边形而言,多边形之间的相邻关系也常由于顶点位置的分离而出现分离和重叠两种错误,如图2-8所示。
图2-7 线性地物矢量化的常见拓扑关系错误(改自Conolly & Lake 2006,84页)
图2-8 面状地物矢量化的常见拓扑关系错误(改自Conolly & Lake 2006,85页)
常用的GIS软件都提供矢量化程序的后处理功能模块用以检查和修改矢量化过程中产生的错误和图形之间的拓扑关系。除此之外,我们还可以使用一些特殊的矢量化方法以减少产生错误拓扑关系的情况发生,比如,在绘制具有相邻关系的多边形时,我们可以采用直线切割的方法将一个大的多边形分割成若干小多边形(cut polygon feature),也就是直接定义多边形之间的公共邻边。
矢量化的过程不仅包含图形的绘制,还包括对各图形属性信息的输入,比如等高线的高程值,遗址的编号、年代、文化属性、面积等。对于性质单一且有规律分布的图形属性,比如等高线的高程值可以在矢量化的过程中采用批处理的方法统一录入;对于性质复杂的图形属性,比如考古遗址,可只输入具有唯一属性的关键字段,如遗址编号,然后通过其他数据库单独记录遗址的属性信息,并通过关键字段的关联建立与图形属性之间的链接关系。