运输系统调查与数据分析是进行运输系统问题诊断、规划、设计、建设、运营、管理的基础性工作,可以为建立交通需求预测模型、分析交通的供需平衡以及交通供需关系的发展趋势等提供基础数据。
运输系统调查方法及数据分析
运输系统调查是利用客观手段,对运输系统交通流及有关的交通现象进行调查,并且对调查资料进行分析和判断,从而了解掌握交通状态及有关交通现象规律的工作过程。通过运输系统调查,可以准确分析评价规划区域交通现状,为交通规划提供全面、系统、真实、可靠的实际参考资料和基础数据,对交通规划涉及的经济、运输、交通量等做出准确可靠的预测,制定出合乎社会发展规律且与交通需求相适应的交通规划目标与方案,进而指导交通建设与发展。
运输系统调查一般分为调查目的、调查设计、调查实施、数据处理、数据分析五个阶段。在调查目的阶段根据交通模型开发与修正要求、交通政策、交通规划方案制定与评价需求等确定一个调查项目后,应收集整理所有调查相关背景信息、基于数据需求和可获取数据资源来设计调查整体架构、协调组织调查人力和调查资源,之后进入调查设计阶段。
调查设计阶段的主要工作内容包括:
1)整理调查相关背景信息。
2)考虑调查时间、费用等约束条件,选择适当的调查方法。
3)编排调查人员、资金、资料等需求计划。
4)确定调查抽样原则和调查对象。
5)确定调查内容并形成调查表格。
调查实施阶段的主要工作内容包括:
1)调查相关人员培训。
2)实施预调查/试调查来检验调查设计能否满足数据需求,并进行必要的修正。
3)现场实施。
4)数据收集与审核。
数据处理阶段的主要工作内容包括:
1)数据编码与录入:对调查项进行数字赋值并录入计算机。
2)数据清洗:以保证所有数据都是有用的。
3)编程与编译:将调查数据整理组织为易于分析的格式。
数据分析阶段的主要工作内容包括统计分析、形成调查成果并进行应用。
运输系统调查内容主要根据规划的对象及目标来确定。调查内容包括的主要调查项目见表2.1。
表2.1 运输系统调查类型、调查对象与交通模型应用
除了以上运输系统调查项目外,还需要进行社会经济基础资料调查,为交通需求预测阶段和运输系统规划设计阶段提供参考。社会经济基础资料调查主要包括以下内容:
1)城市概况。包括城市地理位置、气候、地形、地貌、地质、自然资源、旅游资源等。
2)经济社会基础资料历年数据。包括分区、分类人口资料和国民经济发展相关指标等。
3)土地利用基础资料。包括土地利用现状与规划的土地利用类型、规模、开发强度等。
4)城市交通发展资料。包括城市交通基础设施、车辆保有量、城市交通管理和发展政策等。
5)城市道路网现状资料。包括各级道路基本信息、路网图等。
6)城市相关规划资料。包括城市总体规划、城市综合交通运输规划,以及城市轨道交通、城市道路网等交通专项规划资料。
7)其他资料。包括区域发展背景、城市历史演化、产业发展等资料。
规划资料应收集最新批复的相关规划成果和在编的规划草案。反映现状的数据资料宜采用规划起始年前一年的资料,反映发展历程的数据资料不宜少于5年。现状与发展趋势分析宜采用5年之内的交通调查资料,5年以上的调查资料可作为参考。
随着城市交通信息化水平的提高,交通信息采集和数据挖掘在运输系统调查中的作用日益凸显。具备条件的城市可在充分利用信息化数据的基础上,对运输系统调查的调查项目及内容进行适当调整。常见的信息化数据利用技术包括:
1)利用公交车GPS数据及公交IC卡刷卡数据对公交客流特征和个体日活动链的分析技术。
2)利用车辆GPS数据对行程车速和行程时间可靠性的分析技术。
3)利用视频数据对道路机动车流量和交通起止点(OD)的分析技术。
4)利用移动信息数据对居民出行特征和主要客流聚集地的分析技术。
5)利用公共自行车数据对慢行交通和换乘接驳行为的分析技术。
运输系统调查的最基本目的是采集数据用以估计交通出行相关参数。抽样调查时抽样数据的测定误差可分为抽样误差和非抽样误差。抽样误差是以样本代表总体时的随机误差,其导致参数估计或其他测定不精确。非抽样误差是调查设计和数据采集阶段所发生的各种误差,其导致参数估计不准确。抽样的基本目标应为同时减少抽样误差和非抽样误差,从而提高参数估计的精确性和准确性。
样本设计过程中应考虑调查的整体目标、时间及费用的约束,以及关键变量可获取的信息。重点考虑以下因素进行样本设计:
(1)调查的基本目标及约束
调查的目标通常为分析交通现状、开发交通模型、评价交通政策等。交通调查数据一般用于支持多种交通建模分析(如出行生成、出行分布、方式划分等)和交通政策分析。样本量一方面应满足相应分析系统的需求,另一方面调查的资源(费用预算)往往有一定限制。应计算和分析调查样本量与建模关键变量的期望精度之间的关系。
(2)关键变量及期望精度
在明确调查目标后,对未来数据分析的关键变量进行识别和确定。可对每一个关键变量,根据分析需求设定不同的期望精度水平进行样本量估算。
(3)研究区域人口、抽样框架及抽样单元
应确定研究区域人口,明确调查目标人群。抽样框架提供接触调查目标人群的方式。当抽样框架基于对调查目标单元的非完整列表时,需要对数据库进行扩展以涵盖所有调查目标人群。需要将两个数据资源信息融合时,应尽量减少重复的信息。抽样单元与需要采集的信息类型和数据详细程度相关。
(4)关于关键变量能够获取的信息
基于一个给定的关键变量计算满足精度要求的样本量时,需要估计该变量在调查目标对象中的均值和方差。应在样本设计阶段确定能够提供关键变量的均值与方差信息的数据源,如人口普查数据、经济普查数据、研究区域历史交通调查数据和其他调查数据等。
(5)满足精度要求的抽样方法
抽样方法的选择与调查的目标、研究区域人口及相应的抽样框架与抽样单元、期望的精度相互关联,主要取决于关键变量在调查目标人群中的分布情况。如果关键变量(如小汽车拥有水平、家庭人口规模等)在调查目标人群中呈现均匀分布,达到一定样本量的简单随机抽样方法即可满足要求。当一些变量分布不均时,采用简单随机抽样方法所需要的样本量过大。这种情形下,宜采用分层或分类的抽样方法。
(6)满足精度要求的样本量
在抽样方法、抽样框架和抽样单元确定后,应从以下两个方面来评价样本量:
1)对应于每一个关键变量在一定置信度水平下的期望精度水平,计算满足要求的样本量。
2)在给定样本量的情况下,计算每一个关键变量的期望精度或置信度。
(7)抽样是否满足时间、费用的约束
对应于每一个关键变量在一定置信度水平下的期望精度水平,可以计算得到一组样本量需求。当调查时间、费用预算不能支持理想的样本量时,应在权衡不同样本量与相应的精度水平、置信度水平的基础上确定合理的样本量。同时,也应探索通过改进抽样方法(如采用分层或分组的抽样方法等)来减少样本量需求,以满足调查资源的约束。
(8)样本量所对应的精度与置信度水平
在调查资源约束下,最后确定的样本量往往低于理想的样本量。应重新计算采用的样本量所对应的精度和置信度水平,并分析抽样设计方案的优劣。
抽样应遵循的原则是综合权衡数据采集费用、样本量和数据质量。在数据采集费用的约束下,样本量范围的确定还应满足所选关键变量估计的精度与置信度要求;在一定的样本量范围下,应核算每一个变量的期望精度及期望置信度水平。
对应一个样本量 n 、置信度1 -α ,变量 的标准差 、绝对精度 D 、相对精度 d 可按下式计算:
式中, σ 2 为变量在总人口中的方差; z 统计量对应于置信度1 -α ; N 为总量; μ 为变量在人口中的均值。
对应一个样本量 n 、期望的精度(绝对精度 D 、相对精度 d ),置信度可在按下式计算 z 统计量后查表获得:
或
运输系统调查中各项调查可选择春秋季节无重大事件及恶劣天气的工作日(如周二至周四中一天)同时开展,或结合具体情况分别开展。