定义是将事情呈现、描述出来,是认识主体使用判断或命题的语言逻辑形式,确定一个认识对象或事物在有关事物的综合分类系统中的位置和界限,使这个认识对象或事物从有关事物的综合分类系统中彰显出来的认识行为。一个好的、能为大家所认同的定义,要同时兼顾其外延、内涵、歧义和含糊度。这需要相关学科扎实和深厚的理论基础,需要对相关领域高屋建瓴的把握。纵观国内外相关文献,尽管学者们对空间相似关系进行了一些研究,但是迄今为止还没有一个空间相似关系的明确的或广为接受的定义。下面,对有关文献中对于空间相似关系的描述和定义进行回顾。
与空间相似关系有关的描述首先要追溯到地理学第一定律,该定律对相似关系进行了粗略的描述。地理学第一定律是美国地理学家W. R. Tobler在1970年提出来的,其描述如下:事物之间都是相互联系的,距离越近的事物联系越紧密(Everything is related to everything else, but near things are more related than distant things),也称之为Tobler第一定律。这里有个概念即“distant/near”,中文意思是“远近”,这是一个比较定性的和模糊的概念,即关于距离的定义和空间邻近关系的描述是模糊的。地理学家们在不同的场合,定义了许多“距离”,Tobler自己也曾在文献[46]中列举了众多距离,包括欧式距离、广义距离、切比雪夫距离、马氏距离、明氏距离、大地测量距离、曼哈顿距离、旅行成本距离、拓扑距离、旅行时间距离、词典编纂距离等。归结起来,可以概括为三种距离,即空间距离、时间距离和语义距离。空间距离很好理解,典型的如平面上两点之间的欧氏距离就是空间距离;时间距离是指空间实体在时间轴上的投影之间的距离,如在研究一个城市的发展变迁时,在城市不同历史阶段的地形图的表现上,应该是距离现在越近时(时间距离越短),跟现在的城市地形图的相似度越高。再比如,旅行时间距离,两个点之间的旅游时间距离为从一个点到另一个点的最短时间,可以用取得这一最短时间的一系列指定的航线来表示这个距离;语义距离,以文献[47]中所举东柏林和西柏林的例子,在柏林墙存在时,虽然两者空间距离很接近,但是语义距离(社会经济制度等)很远,故两边的相似度就很低(李小文等,2006)。
Bruns和Egenhofer(1996)曾简单地定义相似关系为:从等价性的偏离程度。该定义简单易懂,但该定义只对空间相似关系的某个侧面进行了描述,即相似是从相等的偏离,由此可以推出相似关系的有关性质(如相似关系的“弱传递性”,因为相似是从等价的偏离,偏离则意味着误差,随着相似的传递,误差则逐步扩大)。但这种描述又带来几个问题,例如,如何表达和度量“等价性的偏离程度”及如何定义“等价性”。该定义只是从研究方法上对相似关系进行了简单的描述。Bruns和Egenhofer利用“从等价性的偏离”的方法,采用空间关系概念邻域图的变换模型,对空间相似关系进行了研究,提出了一种空间场景相似度计算模型。
Goodchild 等(1998)从应用的角度提到相似关系和互操作有关。他提出,两个数据集或者软件系统等遵循统一的约定,就能够很容易进行互操作。Goodchild认为,互操作只能在一个很狭小的领域内实现。因此,在谈到互操作领域内的相似关系时,Goodchild指出为了实现互操作,就要努力拓展互操作的领域,或提高互操作所允许的相似度阈值。在互操作的内容中,考虑相似关系可能会提高互操作的效果。
Holt 和 Benwell(1997)对空间相似关系进行了详细描述和定义。综合考虑空间尺度和空间上下文对空间相似关系定义如下:在某一个特定的粒度(比例尺)和内容(专题属性)上被认为是相似的两个区域。广义上,空间相似关系是指根据特定内容和比例尺对空间数据的匹配和排序。更详细地说,空间相似关系是由这几个因素决定的:内容(功能、使用目的、原因、目标、用户思维范围等)、比例尺(粗糙的或精细的水平)/存储(地域、地址和数据类型等)、技术(搜寻、检索和识别数据的技术方法等)和度量系统。相似关系同时也受时间的影响,即事物或现象发生的时间能够影响到其他与其有相似关系的事物或现象。他所提到的“内容”是由用户而不是由系统自动决定的。Holt对空间相似关系的描述定义及影响空间相似关系的变量用图2.1进行了表达。
图2.1 空间相似关系变量
吴立新等认为空间相似关系包含两方面的含义:一是指空间目标几何形态上的相似,二是指空间物体(群组目标)结构上的相似(吴立新、史文中,2003)。他指出,形态相似分析本身就是分析的目的,在很多情况下是更深分析的基础,提供部分分析依据。对形态相似性的分析有两个途径,一是相似变换下的图形吻合度的分析,二是基于形态参数的聚类分析或相关分析。对于平面图形的相似,可以用以下几种方法进行度量:
·Hamming距离,指两个图形的差异面积。
·Hausdorff距离,对于两个图形 A 和 B ,其Hausdorff距离计算公式如下:
· 骨架结构。可以通过各种化简方法得到平面图形的骨架线,如果两个图形相似,则其骨架线必然相似;反之,骨架线相似,其图形本身也会很相似;且骨架线的比较比源图形的比较更容易。
结构的相似主要是指群组目标之间的相似,也是本文研究的主要内容。因为结构相似不仅包含了单个图形个体的相似,从格式塔认知心理学来说,其整体结构分布,尤其是其空间关系更是研究和分析的重点。在研究地理现象的空间分布和布局中,经常会自觉不自觉地用到空间群组目标的相似性分类,如水系通常被分为树状结构、网状结构等,这种结构的相似性就是分类的基础。
闫浩文等(2009)从多尺度地图自动综合结果的质量评价为目的出发,研究并指出了多尺度地图空间的相似关系的一些基本问题。基于“相似就是指事物之间在特征方面的一一对应”的认识,采用集合学的方法,对空间相似关系进行了定义。该定义虽是针对多尺度地图目标的相似关系,但也适用于一般的情况。该定义如下:
定义1: 设有 、 两个地理空间目标,其特征集合分别记为 、 ,且 、 均为非空集合。若 ,则称相似特征集 为目标 、 的空间相似关系。空间目标之间的空间相似关系强弱可用相似度来衡量,相似度值域为[0,1]。相似度的大小具有模糊性,难以精确计算。
定义1采用集合学进行定义,有着严密的数学基础,但是该描述过于宽泛,不仅适用于地理空间目标,也适用于其他目标。下面,针对地理空间目标,将该定义涉及的特征集合进行具体化。
在地理信息科学领域,有关空间实体目标的描述数据一般来说可以分为两类,即空间特征数据和属性特征数据(陈述彭等,2003),又称为几何特征数据和非几何特征数据。其中,空间特征数据中主要包括描述空间实体目标的几何特征数据,如位置、维数、大小、形状等,以及描述空间实体目标之间空间关系的几何关系数据,如实体之间的拓扑、方向、距离关系数据等。如此,对应到空间相似关系,空间实体目标之间的相似特征集合可以概括为几何特征相似、空间关系相似和属性(语义)相似。
关于空间关系在空间目标之间的相似关系中的作用,H. T. Bruns和M. Egenhofer(1996)提到一个重要原则:空间目标之间的拓扑、方向和距离关系是最关键的,因为这几种关系抓住了空间目标集合体——空间场景的本质。同时,Egenhofer和Mark(1995)提到,拓扑关系通常能够抓住空间布局的本质——拓扑关系起主导作用,其他可度量的关系起提炼作用。故在空间关系集合中,空间拓扑关系、方向关系和距离关系必不可少。
综上所述,具体到空间群组目标之间的相似关系,作为对定义1的补充,有定义2如下:
定义2 :空间群组目标的特征集合 C—— = {空间关系集合,几何特征集合,语义特征集合},其中,空间关系集合包括{空间拓扑关系,空间方向关系,空间距离关系}。