摘 要: 从GIS研究理论的发展,介绍了空间数据及融合理论、空间曲面理论、空间认知理论、地图可视化理论、空间数据建模理论的研讨成果,为GIS研究和应用提供极好的参考。
关键词: GIS;理论框架;发展进程
GIS是管理和分析空间数据的科学技术,是集地理学、计算机科学、测绘学、空间科学、信息科学和管理科学等学科为一体的新兴边缘学科,因此它的发展和应用具有多学科交叉的显著特征,也体现当代科学技术发展的一个明显特点。
李德仁院士指出,由于GIS带有十分明显的面向应用和技术导引的特点,实际上,在没有形成地理信息理论之前就已广为应用并蓬勃发展。国际GIS知名学者,美国加州大学Goodchild教授在Towards a Science of Geographic Information一文中也曾指出,GIS的“技术导引”和“应用导引”两大特点丝毫不影响GIS的研究特性和逐步形成它作为一门科学的作用。实际上,正是由于GIS的广泛应用和大量实践的结果,逐步导致GIS理论框架的形成(图1)。
本文拟在该理论框架的基础上,就其中的空间数据及其融合理论、空间曲面理论、空间认知理论、地图可视化理论、GIS理论的进一步发展等内容、内涵及意义进行讨论,以期集思广益,进一步推进地理信息科学的发展。
图1 地理信息科学的理论框架(据陈述彭,1997)
GIS研究和解决的是空间问题,空间数据是GIS的核心概念。从GIS的数据输入、空间实体的表达、空间事物和现象的特征描述,直到GIS分析和运算结果的输出,无不与空间数据紧密关联。空间数据是地球表层所有涉及地理位置的事物或现象的数字表达,数字化和这些数字为所有地理事物输入计算机提供了可能性。这一伟大变格的创始人正是加拿大学者诺基尔·汤姆林逊博士,他于1962年提出了“把地图变成数字形式,以便于计算机处理和分析”的新思路。
空间数据从最初的数据生产已经发展到构成地理信息科学原理的重要组成部分,例如空间数据对实体的表达,从矢量和栅格进展到两者的相互转换和一体化;空间数据对实体的特征描述,从定位和定性延伸到时空一体化;空间数据的组织,从图层和图幅发展到面向对象的整体数据模型;空间数据的管理,从20世纪70年代中期的文件管理、80年代中期的混合数据管理,已经发展到80年代末期的全数据库管理的新阶段。
空间数据融合理论是研究如何将不同来源、不同尺度、不同格式、不同时态和不同精度的数据进行集成和融合,以便充分利用多源数据的有用信息,减少数据采集的高额开销,提高数据的复用度和共享度。数据融合需要研究不同空间数据的转换,包括比例尺缩放、图形平移和旋转等,特别是与地图投影变换关系最为密切。GIS不但继承了测绘学及其分支科学的有关理论,例如误差理论、地图投影理论、图形理论及其相关的算法等,而且大大拓展了传统的空间数据变换算法,提出了基于GIS的数据集成技术框架和方法以及基于语义层次的数据转换共享模型。这种模型的转换特点是既有数据结构的转换,又有语义数据的操作和转换,提供了崭新的数据互操作模式,其最终目的是使数据客户能读取任意数据服务器提供的空间数据,实现数据的共享。这是开放GIS的概念,也是当前GIS的研究热点。
从20世纪60年代初诞生的GIS空间数据概念,从最初关于地理要素的位置、形状及要素间关系等信息的载体,已经发展到空间元数据、空间数据库、空间数据基础设施、空间数据转换标准、空间参照、空间联结、空间建模、空间分析、空间查询、空间统计等,其内涵和功能已得到极大地提高。空间数据对GIS的意义,过去只认为它是GIS的操作对象,现在感悟到它永远是GIS的“根”,GIS一切的发展都是基于这个“根”,它是GIS理论的重要基础。
空间曲面是地理空间(Geo-spatial)的组成部分。研究地理空间,除了建立地理空间的定位参考框架,还必须分析地理空间特征实体的几何形态、时空分布及相互关系。地理空间特征实体指具有形状、属性和时序特征的空间对象或地理实体,包括点、线、面、曲面和体,也是GIS表示、空间数据处理和空间分析的主要对象。其中,曲面有连续曲面和梯状曲面之分(图2)。
如图2(a)所示,连续曲面是指其上的空间对象(如地势、气温、降雨等)是呈连续方式分布和变化的,他们对应的空间模型是连续曲面,该曲面上各点对应的特征值可以通过数学插值法求取,例如无偏估计和方差最小原理等,内插出所需要点的数值,曲面上的空间实体可以用等值线法表示。如图2(b)所示,梯状曲面的情况则不相同,其上的空间对象(如耕地、街坊、产值等)是呈非连续分布和变化的,它们对应的空间模型是梯状曲面,梯状曲面又称为统计曲面,该曲面上各点对应的特征值是由对应的统计单元确定的,因此,曲面上的空间对象常常是经济或社会现象,只能采用分级统计图的制图方法表示。
图2 空间曲面的类型
空间曲面理论是由美国地理学家G.F.Jenks教授于20世纪70年代提出的,他在关于现代统计地图制作方法的论述中指出,有人对空间与图形关系存在着错误的认知,混淆了连续曲面与梯状曲面的不同概念,常常造成了实际应用上的错误。事实上,这种错误情况目前也还存在。例如有人在基于GIS技术和方法的应用中,常常对空间曲面的类型和性质不加区分,对一些经济或统计现象也照搬常用的空间内插方法,甚至将梯状曲面上的社会经济现象也搬到连续的三维立体图上,造成对读者的误导,确实有必要重新提起警示。
显然,空间曲面理论关系到GIS数据建库策略的选择、空间内插方法的选择、空间分析方法和空间表示方法的确定等,对GIS应用具有重要的指导意义。
空间认知(Spatial Cognition)是人们获取和利用知识以及关于空间环境信念的思维过程,是对事物和现象的发生、影响、因果进行分析研究的基础,是地理学和心理学的交叉研究领域(图3)。
人类对空间实体或现象的认识是一个复杂的过程,鲁学军等对这个过程进行了描述和表达(图4)。
图3 空间认知概念(据邬伦等,2001)
图4 空间认知图示(据鲁学军等,1998)
从这个图示可以看出,空间认知从地球表层的地理对象开始,经过知觉、注意、表象、记忆、学习、思维、语言、概念形成,直至问题求解和行为决策等有机联系的信息处理流程,其中的地理规则包含着地理学的基本理论和知识结构,它对空间认知的规范和指导具有首要的意义。
地理学对促进地理信息科学理论发展的意义,从美国NCGIA对GISystem和GIScience核心课程的不同规划可以看出来。例如,GISystem核心课程包括GIS导论、GIS技术和GIS应用三门课程,而GIScience核心课程包括GIS的基本地理概念、GIS地理概念的实现和社会中的地理信息技术三门课程,可见地理信息科学与地理学之间的关联性何等密切。
那么,空间认知理论对GIS都有哪些重要意义?以下,就笔者的初步认识做出归纳。
(1)根据王家耀教授对地理环境信息流在人脑中的处理过程和同样的信息流在GIS中处理过程的比较研究表明,在GIS引入空间认知理论,具体包括人的思维、智力干预和质量评定等,对于提高GIS产品质量、实现GIS的智能决策目标等,具有重要意义。
(2)根据马荣华博士对空间认知与GIS空间数据组织的研究表明,在GIS空间数据及数据组织中引入空间认知理论,能很顺畅地解决现实世界的抽象,最终建立基于特征的时空一体化数据组织框架和分布式的GIS数据组织框架,空间认知理论提供了从真实世界到GIS数据库映射的具体解决方案。
(3)空间分析是GIS的核心,空间分析的原理是基于地学的理解、知识和经验。空间认知理论恰好为地学知识的获取、凝练、融合、推理,以及揭示隐藏在知识中的内涵和规律等提供了理论依托和认知引导。
(4)应用模型是GIS系统应用和取得效益的重要保证,而GIS应用模型的构建涉及人们对客观世界的认知分析、概念映射、行为决策和实践检验等,这与图4所示的空间认知图示的思路是相一致的。因此,空间认知理论是构建GIS应用模型的直接依据。
(5)如前所述,GIS是表达空间的系统,而系统设计者与系统用户的认知模型是不一致的,前者以抽象思维为主,后者以形象思维为主。如何将两者统一起来,包括从系统需求分析直至系统用户界面的设计,都必须始终以空间认知理论为指导,做到系统设计的各个环节都能贯彻以人为本的认知原则,这是非常重要的。
国际地图学协会(ICA)于 1995 年成立可视化委员会(Commission on Visualization),1996年可视化委员会与美国计算机协会图形学专业组进行跨学科合作,探讨科学计算机可视化与地图可视化的连接与交流。1999年ICA可视化委员会重新组合为现在的可视化和虚拟环境委员会。从此,对于地图可视化理论的研究,受到了广泛的关注。
地图可视化理论从最早的空间数据图形化概念,已经扩展到初步形成可视化的理论框架(图5)。
图5 地图可视化理论框架
如图5所示,地图可视化理论框架由视觉变量和符号结构及四个理论模块组成。任何地图和图形都是由基本图形要素组成的,基本图形要素又称为视觉变量和图形变量,它们包括颜色、亮度、尺寸、形状、密度、方向和位置,它们构成无限种组合方式,为地图可视化提供了丰富多彩的表现形式。随着多媒体计算机技术和虚拟现实技术的发展,地图可视化变量已经由静态视觉变量扩展到动态视觉变量(时间)、听觉变量(声音)、嗅觉和触觉变量等,它们的组合和应用大大提高了人对所表达的地理现象的感知和理解。
四个可视化理论模块包括目标任务、表现主题、图型元素和技术手段。目标任务是指可视化所针对的目标和任务。地图可视化的早期目标任务只是现实世界或静态空间数据的直观显示,即用户在确定空间数据和选择视觉变量的基础上,进行全要素、分图层或分区域的图形显示,不同属性的数据能用不同的尺寸、颜色和纹理来区分,并配以相应的图示图例,便可以将地理数据搬上屏幕或得到一幅简单的电子地图。但是随着地学研究的深入和可视化应用领域的拓展,目前可视化的目标任务已延伸到地学模拟、动态演变、预测预报和规划决策等。这时,目标任务的实现与表现主题、图型元素和技术手段结合,有了十分紧密的联系。
表现主题是指直观显示、交互操作、动态演示或者多维展示等。表现主题的选择是根据可视化的目标任务来确定的,一般常规的表现是指直观显示;对于宏大数据或规划决策信息的可视化,需要交互操作,实现信息查询检索和方案比较研究;对于具有时间维的动态空间信息,需要采用动态演示,表示某一时段内某种现象的移动与变迁过程;对于空间环境信息,则需要采用多维展示,并调用多种技术工具和虚拟现实技术,才能有效表达纷繁复杂的客观世界。
图型元素指地图可视化产品的时空元素和类型,包括0维空间、1维空间、2维空间、2维空间+时间、3维空间、3维空间+时间等。其中,2维空间图型是地图可视化的一种重要和基本的图型,也包括显示在屏幕上的数字地图,以及基于计算机数字处理和屏幕显示的交互式数字地图等。3维空间图型是以真三维或动画形式来表达地理环境信息,不但具有真实的立体效果,还具有用户观察和量测等功能。3维空间+时间图型可以提供空间实体或现象的立体感和随时间而变化的动态效果及沉浸感。
根据图型元素选择表达和演绎的技术方法,包括信息表示和传输的载体,如数字、文字、声音、图形、图像等;多媒体技术,如音频、视频、动画等;以及超文本、超媒体、网络和虚拟现实技术等。这些传统的和先进的技术手段对地图可视化的信息表示、组织、管理和传输不但提供了有效的方法,而且为地图可视化理论奠定了重要基础。
可视化对GIS的重要意义在于,在GIS系统分析阶段,可视化是GIS用户与设计人员交流和合作的媒介;在GIS系统设计阶段,可视化是各项技术方案论证的工具;在GIS系统运行阶段,可视化就是系统演示的对象,特别是GIS产品的制作,地图可视化直接为产品制作提供理论依据。因此,地图可视化理论是GIS理论的重要组成部分。
20世纪80年代以来,国际学术界加强了对GIS基础理论和应用基础理论的研究,尤其是1995年美国大学地理信息科学协会(UCGIS)提出地理信息科学的十大优先研究课题,已经取得了很大的进展,其中有些已经取得了令人激动的成果,例如GIS空间数据建模理论。空间数据建模理论是研究地理空间的现实世界到计算机信息世界的抽象,为最后建立空间数据库提供逻辑框架,也称为空间数据模型。这是GIS理论的一个黄金研究课题,从第一代的拓扑结构数据模型(Coverage)、第二代的空间实体数据模型(Shapefile)、第三代的面向对象的关系数据模型(Geodatabase),到第四代目前正在研究的面向对象的整体数据模型,表明这是一个永不褪色的研究课题。第四代数据模型的研究内容包括地球表层的目标集、地理空间三维特征、地理空间多尺度特征及其互动、地理实体时态特征、地理空间多尺度特征及其互动、地理实体时态特征、地理实体复合图层构建和管理、空间数据融合和基于位置的信息集成等,可见这是一个目标宏大的研究课题。
空间数据挖掘与知识获取理论,这是随着GIS空间数据库的积累、国内外各类语料库建设以及以文本为载体的大量文献存储而提出的一项新的研究课题。它旨在研究从空间数据库中发现和提取隐性知识与特征,或从文本中发现和提取显性知识与特征;将大量非结构化数据转换为结构化的计算机可理解的数据格式;通过与本体(Ontology)理论的结合,构建多级语义网络,解决更深层次的数据共享、互操作、分类框架和服务框架构建;以及将这些数据、信息或知识应用于解决某项特定任务,如数据库更新、知识库与规则库构建、GIS空间查询、空间方位关系构建与分析、领域空间知识获取、图形和情景重建等。在这些方面,以闾国年教授领衔的研究团队已获得了成果,并且充分展示了该理论领域的发展潜力和应用前景。
GIS理论进一步发展的另一值得关注的方向是空间数据不确定性理论的研究,该项研究关乎GIS空间数据及其产品质量的可用性。空间数据的不确定性是指空间数据中存在的位置不确定性、属性不确定性、时域不确定性、拓扑关系不一致性及数据本身的不完整性。位置不确定性指GIS中某一被描述实体与其地面上真实实体位置上存在差别;属性不确定性指某一实体被描述的属性与其实际属性之差异;时域不确定性指某一实体在时间描述上存在差错;拓扑关系不一致性指数据结构内部存在不一致性;数据的不完整性指对于给定的空间实体,GIS没有完整地给出该实体的语义特征等。空间数据不确定性产生的原因如图6所示。
图6 空间数据不确定性来源及其传播(据何彬彬等,2004)
根据空间数据不确定性来源,其研究内容包括:由于空间数据不确定性存在于GIS数据处理的各个环节,并相互传递和扩散,应研究其不同来源的性质和类型,建立度量指标和表达式,以便不确定性分析和误差控制;对数字化误差的模拟研究,利用各种不同分布的随机变量的抽样序列,模拟实际系统的概率统计模拟模型,并给出问题解的统计估计值;研究数据库中元数据包含的有关数据质量信息,了解和跟踪空间数据质量状况和变化,及时做出质量评定;研究利用地理相关分析法、基于知识的属性规则分析法,以及图形和属性数据中的质量元素,进行数据不确定性检查和评价,并提出数据质量控制的解决方案。
[1]黄杏元,马劲松.高校GIS专业人才培养若干问题的探讨[J].国土资源遥感,2002(3).
[2]李德仁.关于地理信息理论的若干思考[J].地理信息世界,1996(4).
[3]Goodchild M.F.Towards a science of geographic information[M]//Geographic Information 1991:the Yearbook of the Association for Geographic Information.Talor&Francis,London,1991.
[4]陈述彭.地理信息系统的应用基础研究[J].地球信息,1997(4).
[5]Jenks G.F.Contemporary statistical maps-evidence of spatial and graphic Ignorance[J].The American Cartographer,1976(3):11-18.
[6]邬伦,刘瑜,张晶,等.地理信息系统——原理、方法和应用[M].北京:科学出版社,2001.
[7]鲁学军,承继成.地理认知理论内涵分析[J].地理学报,1998,53(2).
[8]王家耀,陈毓芬.理论地图学[M].北京:解放军出版社,2000.
[9]马荣华.地理空间认知与GIS空间数据组织研究[D].南京:南京大学,2002.
[10]罗宾逊A.H.,赛尔R.D.,莫里逊J.L.,等.地图学原理[M].6版,李道义,等译.北京:测绘出版社,1989.
[11]方裕.新一代GIS软件技术研究[C]//中国遥感奋进创新二十年学术讨论会.北京:中国气象学会,2001.
[12]舒飞跃.基于文本的土地管理领域空间知识获取与应用研究[D].南京:南京师范大学,2009.
[13]蒋文明.面向中文文本的空间方位关系抽取方法研究[D].南京:南京师范大学,2010.
Abstract: The discussed result of the theories of spatial data and fusion,space surface,space cognition,map visualization as well as spatial data modeling which based on the development of GIS research theory is offer a good reference for GIS study and application
Key words: GIS;theoretical framework;development process