交通信息融合定义为:一个处理探测、互联、相关、估计以及组合多源信息和数据的多层次多方面的过程,以便获得准确的交通状态和参数估计,并将相关信息用于交通管理的决策支持。
多源交通信息融合的目的是通过对不同来源的交通流数据进行融合处理,以得到比任何从单个数据源获得的数据更全面、准确的交通流状况的信息。
多源交通信息融合模型分为三级(如图2-16所示),最基础级是数据级融合,它只完成数据的预处理和简单关联;第二级是特征级融合,就是根据现有数据的特征预测交通参数;第三级是状态级融合,根据当前交通流信息判断交通状态。
图2-16 交通信息融合模型
多源交通流数据级融合技术包括数据预处理技术、相同数据来源的交通流数据融合技术以及不同数据来源的交通流数据融合技术,其中相同数据来源的数据是指来自同一种检测手段获取的数据,而不同数据来源的数据是指采用两种或以上的检测手段获得的数据。不同数据来源的数据信息由于格式和内容不一致,融合起来就比较困难,涉及的技术比较多。不同来源的数据融合过程包括信息预处理、多种检测器数据的融合以及固定检测器数据和浮动车数据的融合。
脉冲干扰检测:检测方法为阈值法,即两个相邻车辆脉冲的时间间隔应该大于车辆在检测区域的最小停留时间。
如图2-17所示,假设车辆长度为 l ,检测区域宽度为 d ,车辆行驶速度为 v ,车辆在检测区域停留的时间为车辆长度加上检测区域宽度除以车速:
图2-17 车辆在检测区域停留示意
若检测器的检测脉冲间隔为 w ,则出现下一辆车的最小脉冲间隔为
引入一个变量“有效车长”,并将其定义为
L E = l + d (2-30)
则式(2-29)可转换为
由于每个车辆的有效车长都不相同,因此采用平均有效车长
式中, L E i 为第 i 辆车的有效车长。
同时使用最大设计时速 v max 代替车辆速度,于是就可以得到两个相邻车辆脉冲的最小间隔为
如果相邻车辆脉冲间隔小于 N min 则表示有干扰。一般检测器原始脉冲数据是一串由0和1组成的字符串,其中0表示无车,1表示有车,因此相邻车辆的脉冲间隔可以通过计算两相邻“01”字符串之间的字符个数来获得。
速度数据异常检测:检测方法为阈值法,如果检测的速度值大于最大设计时速,则认为是异常数据。
若检测到脉冲数据中存在干扰,即两个有车脉冲出现的时间间隔小于最小脉冲间隔时,则认为是一辆车产生的脉冲信号,中间的“低”电平全部用“高”电平代替,即中间的“0”全部用“1”代替。如图2-18所示。
图2-18 脉冲数据异常处理示意
若检测到速度数据中存在异常,即有速度值大于最大设计时速时,则将该速度值剔除。
①交通流量计算。首先根据检测器脉冲数据计算出车辆数,然后用车辆数除以检测时间就得到交通流量。车辆数按照脉冲上升沿或脉冲下降沿计算,车辆数等于上升沿出现的次数,在原始数据中“01”表示上升沿,因此只需要计算字符串中“01”出现的次数就是车辆数。检测时间可以通过总脉冲数乘以脉冲宽度来获得,总脉冲数就是字符串中字符的个数。
式中, N 01 表示“01”字符串的个数; N 表示总字符数; w 表示脉冲宽度。
②时间占有率计算。时间占有率等于有车的时间除以总检测时间,也即有车的脉冲数除以总脉冲数,在脉冲字符串中“1”代表有车,因此可以用字符“1”出现的次数除以总字符数。
式中, N 1 表示“1”字符的个数; N 表示总字符数。
③地点车速估计。有些检测器不能直接检测车辆速度,可以按照如下方法估计。
式中, 表示平均有效车长; N 1 和 w 定义同上。
④时间平均速度计算。把每个单车地点速度相加除以总的车辆数即得到时间平均速度。
式中, v i 表示第 i 辆车的地点速度; n 表示车辆数。
⑤空间平均速度计算。根据定义空间平均速度等于路段上所有车辆的行驶距离除以所有车辆的行程时间。
⑥交通密度计算。利用交通密度和交通流量、空间平均速度之间的关系
式中, k 表示交通密度; q 表示交通流量; 表示空间平均速度。
⑦行程时间估计。由于大多数检测器都不能直接检测行程时间,因此必须通过其他的一些检测数据对行程时间进行估计。行程时间估计方法主要分为插值法和基于交通流理论的方法,插值法的适应性比较差,不适合估计高峰交通状况下的行程时间,因此采用基于交通流理论的方法比较可靠,目前像美国、日本、德国等都提出过基于交通流理论的行程时间估计方法,但是这些算法都需要有专家知识作支撑,一些经验参数需经过大量的实际调查才能获得,而且在国外调查分析的参数不一适合国内现状。下面介绍一种基于交通流量和占有率的行程时间估计算法。
根据定义路段行程时间等于路段长度除以路段平均速度
根据交通流量、密度和平均速度之间的关系,可以得到平均速度等于交通流量除以交通密度
而交通密度和占有率存在以下关系
将式(2-41)和式(2-42)代入式(2-40)可得
式中, TT 表示路段行程时间; l 表示路段长度; o 表示时间占有率; q 表示交通流量; 为平均有效车长,其取值范围在2.7~18m之间。
对于能够直接检测出车辆速度的检测器,则使用式(2-40)进行行程时间估计,不能直接检测车辆速度的检测器,则使用式(2-43)进行行程时间估计。
目前,交通检测器的种类越来越多,包括环行线圈检测器、超声波检测器、视频检测器、红外线检测器等,但是各种检测器对不同交通参数的检测性能各不相同。通常检测器都存在交叉灵敏度,表现在检测器的输出值不只决定于一个参量,当其他参量变化时输出值也要发生变化。交通检测器也不例外,如:环行线圈检测车辆存在时由于磁场变化,其检测结果也发生改变。那么环行线圈就存在对磁场强度的交叉灵敏度;视频检测器存在对环境湿度的交叉敏感度。由于各种交通检测器存在交叉灵敏度,使其性能不稳定,测量精度不高。多检测器信息融合技术就是通过对多个参数的监测并采用一定的信息处理方法达到提高每一个参数测量精度的目的。
多种检测器数据融合方法有很多种,用得最多的还是简单加权法,即根据一定的权重将各种检测器数据相加,从而得到融合的数据。这种融合方法的缺点是无法准确定义每种检测器数据的权重,最终的融合数据和实际数据相差较大。以下采用一种基于多属性决策的数据融合算法,该算法不需要给定权重就可获得融合数据,其准确性比简单加权法高。
将各种可能的融合输出值组成决策方案,每种决策方案具有三个属性,即检测精度、与历史值的偏差、与总体平均值的偏差,将属性和方案组成决策矩阵,使用信息熵方法计算每种方案的属性权重,然后使用简单加权法进行决策找出最优方案,该方案对应的值就是融合输出值。
①定义决策方案。假设 x 1 , x 2 ,…, x n 为检测器的检测值,取其中任意个检测值组成集合,每个集合就是一个融合决策方案。
②定义方案属性。影响检测准确度的主要因素是检测精度和误差,因此判断一个融合值是否准确主要考虑检测精度和误差,而检测精度是固定的并且只与检测器种类有关,误差主要考虑历史偏差和总体平均值偏差。
对于任意一个方案 A ={ x 1 , x 2 ,…, x m }, x 1 , x 2 ,…, x m 为检测器的检测值, d 1 , d 2 ,…, d m 为对应的检测精度,则方案 A 的检测精度属性值为
历史偏差属性值为
总体平均偏差属性值为
式中, x h 表示历史平均值; x 表示方案 A 所有检测值的平均值。
采用信息熵方法确定基础权重系数。
假设决策矩阵 D 为 m × n 矩阵, m 为方案数, n 为属性数,其中元素 x ij 表示第 i 个方案的第 j 个属性值,则方案关于属性 j 的评价定义为
方案关于属性 j 的熵为
这里的 k 表示一个常量, k =1/ln m 。
信息偏差度定义为 d j =1- E j
定义第j个属性权重系数为:
以下采用简单加权法进行决策。
使用简单加权和方法计算每个方案的权重
取具有最小权重的方案作为最优方案
式中,2 Ω 为所有备选方案的集合; A 为备选方案中的任意一个方案。
融合输出值为最优方案中各个元素的平均值。
浮动车数据和固定检测器数据属于不同数据来源的数据,浮动车数据采集的范围广泛,数据量大,但是数据的准确度不高,检测器数据采集的是固定地点的数据、范围相对较小,但是采集准确度高,这两种数据各有优缺点,如果将两种数据进行融合,可以既提高数据采集的范围,又提高数据采集的准确度。
浮动车数据和检测器数据都经过预处理之后,其数据格式已经基本一致,因此我们只需要进行同种数据的融合。融合的规则为:交通流量、交通密度、占有率、排队长度信息以检测器数据为准,因为检测器对这些数据的检测准确度要高于浮动车数据;行程时间信息以浮动车数据为准,因为检测器不能直接检测行程时间,其行程时间信息都源于估计,而浮动车采集的行程时间都是根据实际GPS时间数据计算出来的,其准确度比较高;平均速度信息以两者的加权平均获取。
式中, x ( d , t )为融合数据; x d ( d , t )为检测器数据; x f ( d , t )为浮动车数据; v 为速度; q 为交通流量; k 为交通密度; o 为占有率; N 为排队长度; T t 为行程时间; α 为加权系数。
采用一般检测手段检测的交通流信息往往具有滞后性,实现城市交通控制和诱导的关键是道路交通状况的预测,也就是采用相应的技术,以有效地利用实时交通数据信息滚动预测未来几分钟内的交通状况。根据预测的交通流信息实施交通控制,以避免交通拥挤,实现交通的畅通。
交通流信息预测主要包括路段交通流信息预测和路口交通流预测。
路段交通流信息预测主要包括交通流量预测、行程时间预测和行程车速预测等。交通流量是交通控制配时的重要指标,根据历史交通流量或者上下游检测断面的交通流量进行预测,可以获得未来时段内到达停车线的交通流量,从而优化交通控制配时,预防出现交通拥堵。行程车速是衡量道路通畅的重要指标,通过综合行程车速和占有率等数据可以预测交通拥堵状况,通过预测行程车速可以预测车流的未来行程时间。路段的平均行程时间是进行交通流诱导的主要依据和描述交通状态的重要指标,通过预测行程时间结合交通流量可以获得车流到达停车线的情况,从而计算求得排队长度等信息,为交通控制目标优化提供参数。
交通流预测的方法有三种,第一种是根据历史信息进行建模拟合,获得交通流参数与时间的关系模型,从而推断未来时间内的交通流信息;第二种是根据历史信息进行指数平滑预算,得出未来交通流参数与过去时段的交通流参数之间的关系模型,从而推断未来时间内的交通流信息;第三种是采用人工神经网络方法,这种方法不需要建立模型,只需足够的数据和时间让神经网络进行学习,从而通过神经网络的学习模型预测未来的交通流参数。第一、二种方法预测的准确度不高,因为以目前的技术水平尚无法得到正确的交通模型。一些文献中的研究表明,采用人工神经网络方法,不需要建立任何交通模型,其预测的交通流信息也比较准确。
路段交通流与历史交通流、相邻路段交通流都存在着一定关系,这种关系可以用神经网络来描述。
图2-19中, q 表示交通流量; o 表示占有率; sms 表示空间平均速度; tms 表示时间平均速度;1~ n 0 表示相连路段。
图2-19 神经网络结构图
输入节点由各个相连路段当前时段的交通流量、占有率、空间平均速度、时间平均速度组成,假设关联路段数为 n 0 ,则输入节点数为4( n 0 +1),输出为未来时段的交通流量、占有率、空间平均速度、时间平均速度,输出节点数为4,隐含层节点根据经验公式取 。
RBF网络的学习过程分为两个阶段:第一阶段,根据所有的输入样本决定隐含层各节点的高斯函数的中心值 c j 和标准化常数 σ j ;第二阶段,在确定完隐含层的参数之后,根据样本,利用最小二乘原则,求出输出层权值 w j 。
中心值和标准化常数调整算法采用K-Means聚类算法(见图2-20)。
图2-20 RBF隐层节点中心值和标准化常数调整算法流程
第一步,随机选取初始中心 C 0 ;
第二步,选择第一组输入样本,按照 C 0 进行分类,把每一类的均值作为新的中心值;
第三步,重新分类,直到前后两次分类不再发生变化为止,此时的各个中心值作为隐含层各节点的高斯函数的中心值;
第四步,标准化常数 σ j = α || c i - c j ||,|| c i - c j ||表示第 j 类与它的最近邻的第 i 类的欧式距离, α 介于1.0到2.0之间。
权值调整采用最小二乘法。
第一步,将隐含层的输出和实际输出组成一个多元方程组矩阵
GW = Y (2-51)
式中, G 为隐含层神经元输出矩阵; W 为权重矩阵; Y 为实际输出矩阵。
第二步,根据最小二乘法和奇异阵分解求伪逆。
将隐含层神经元输出矩阵 G 作奇异阵分解
G = UWV T (2-52)
利用最小二乘原则求权重矩阵
W = G -1 Y = VW -1 U T Y (2-53)
学习样本数越多越利于获取准确的神经网络参数,其预测的结果也会越准确;但是学习样本数不宜过多,样本数太多会导致神经网络学习过缓,耗费大量资源。因此学习样本数据采用过去一年同时段的历史数据比较适宜。
输入各个相连路段当前时段的交通流量、占有率、空间平均速度、时间平均速度值,利用上面已经学习好的神经网络就可以获得未来时段的交通流量、占有率、平均速度等。
实时、准确、可靠的下游交叉口交通流预测是实现交通信号实时优化控制的前提和基础。由于交通流时间序列具有噪声、不稳定、随机性、非线性等特点,使得以常规数学模型为基础建立的交叉口交通量预测算法在预测精度和实时性方面存在一些问题。
在短时交通流预测领域的研究中,常见的预测模型和方法有:历史平均法、线性回归法、光谱分析法、时间序列法、卡尔曼滤波法、人工神经网络等。传统的基于最小二乘法的回归预测模型虽然简单易用,却对复杂非线性的预测数据无能为力。而采用遗传算法优化的人工神经网络具有强大的处理非线性数据的能力,但其神经网络结构需要根据经验确定,且存在过学习问题。支持向量机和粒子群优化算法的出现,为短时交通流预测提供了新途径。本书结合粒子群优化算法的全局寻优速度快、易于实现的特点和支持向量机泛化能力强的优点,应用这两种技术进行短时交通流预测。
支持向量机(Support Vector Machine)是Vapnik等人根据统计学理论提出的一种新的通用学习方法,它是建立在统计学理论的VC维(Vapnik Chervonenks Dimension)理论和结构风险最小原理(Structural Risk Minimization Inductive Principle)基础上的,能较好地解决小样本、非线性、高维数和局部极小点等实际问题,已成为机器学习界的研究热点之一,并成功地应用于分类、函数逼近和实践序列预测等方面。城市短时交通流预测问题也可以看作是对交通流量及其影响因素之间的复杂的非线性函数关系的逼近问题。基于上述考虑,本研究将支持向量机理论引入短时交通流预测中。
支持向量回归机原理如下。
回归分析要解决的问题是根据给定的样本数据集{( x i , y i ), i =1,2,…, k },寻找一个反映样本数据相关性的最优函数关系
y = f ( x )= w · φ ( x )+ b (2-54)
定义不灵敏函数 ε 作为误差函数回归分析问题可以转化为所有样本点到所求超平面的距离都小于 ε ( ε 为任意小的值)的问题,等同于求解如下二次凸规划问题
当个别样本点到所求超平面的距离大于 ε 时, ε 超出的偏差相当于SVM分类中引入的松弛变量 ξ i 、 ξ * i ( ξ i ≥0; ξ * i ≥0),引入容错惩罚因子 C ,寻求最优回归超平面的二次凸规划问题便转化为求
的最小值问题。
其对偶最优化问题的表达形式为
式中, Q ij = K ( x i , x j )≡ φ ( x i ) T ф ( x j )为核函数。
常见的核函数如下。
多项式核函数 K ( x i , x j )=( x i · x j +1) p
高斯径向基函数(RBF)核函数
K ( x i , x j )=exp(- γ ‖ x i - x j ‖ 2 ), γ >0
Sigmoid核函数 K ( x i , x j )=tanh( γx T i · x j + r )
式中,tanh是双曲正切函数; γ 和 r 均为核函数。
最终的SVR非线性回归函数为
对于上述用于回归分析的支持向量机,要注意以下几点。
采用支持向量机求解回归估计问题时,需要选择一核函数。尽管只要满足Mercer条件的函数理论上都可选为核函数,但对于特定问题,由不同的核函数得到的回归估计也会有很大不同,不存在性能优越于其他核函数的核函数。因此针对某一特定问题,如何选择核函数是至关重要的。另外,即使选择了某类核函数,其相应的参数也有如何选择的问题,例如RBF核函数中的参数 γ 。
对于设计参数 C 和 ε 的选择存在同样问题。 C 取的小,则对样本数据中超出 ε 限制的样本惩罚就小,训练误差就变大,模型泛化能力就差。 C 取的过大,相应的 > w T w (即VC维)的权重就小,模型泛化能力也会变差。 ε 取值较小,回归估计精度高,代价是支持向量数增多; ε 取值较大,则回归估计的精度降低,但支持向量数量减少,SVR的系数稀疏性大。
因此,在建立基于支持向量机回归分析的短时交通流预测模型时,要对模型参数进行优化,从而提高模型的预测精度。利用粒子群优化算法可以快速搜索到最优的参数,因此本研究采用粒子群算法优化支持向量机模型参数。下面先介绍粒子群优化算法的原理。
粒子群优化(Particle Swarm Optimization,PSO)算法,源于人们对鸟类在觅食过程中的迁徙和群集(Flocking)行为的研究,是由J.Kennedy和R Eberhart等于1995年开发的一种进化计算(Evolutionary Computation)技术。
在粒子群优化算法中,每个备选的解被称为一个“粒子”,多个粒子共存,合作寻优(类似鸟群寻找食物),每个粒子根据它自身的“经验”和粒子群的最佳“经验”在问题空间中向更好的位置“飞行”,搜索最优解。多个解构成的解集相当于一个鸟群,解集的进化相当于鸟群从一地到另一地的迁徙,每代进化中的最优解相当于寻找食源过程中鸟群之间传递的信息,食源相当于全局最优解。
假设优化问题的目标搜索空间为 N 维,粒子群规模为 M ,其中第 i 个粒子在 N 维空间里的位置 X i =( x i1 , x i2 ,…, x iN ) T , i ∈{1,2,…, M };飞行速度 V i =( v i1 , v i2 ,…, v iN ) T t= , ,…, ) T 分别为第 i 个粒子曾经到达的最大适应值及其对应的位置。 Gbest 为粒子群所有粒子经历过的最好位置,其索引号为 g 。则对于第 k +1代,粒子根据如下公式更新粒子的速度和位置
式中, v id 为第 i 个粒子飞行速度向量的第 d 维分量; x id 为第 i 个粒子的位置向量的第 d 维分量; c 1 , c 2 为学习因子,也称为加速度系数,一般取 c 1 = c 2 =2; w 为惯性权重; rand ( )为(0,1)之间的随机数。
式(2-58)中,第一项为粒子先前的速度; c 1 × rand ( )×( - x id )项为“认知项(Cognitive Term)”,该项与粒子的认知经验相关; c 2 × rand ( )×( - x id )项为“社会项(Social Term)”,它代表粒子间的信息共享与合作。式(2-59)为粒子 i 的新坐标位置。
PSO算法的流程如下。
①初始化:设群体规模为 M ,在允许的范围内随机初始化粒子群中每一粒子的初始位置和速度。
②评价:评价每个粒子的适应值,即计算每个粒子的目标函数 fitness i 。
③找出最优解:对所有的 i ∈{1,2,…, M },若 fitness i > Pbest i ,则置 fitness i = Pbest i , = X i ;若 fitness i > Gbest ,则置 Gbest 的索引号 g = i 。
④更新速度位置:根据式(2-58)和式(2-59),更新每个粒子的速度和位置。
⑤检查终止条件:如果达到最大迭代次数 gen max 或最优解停滞不再变化,终止迭代,否则返回。
粒子群优化算法和遗传算法都可以用来优化支持向量机模型的参数,两者共同之处有:随机初始化种群,使用适应值来评价个体的优劣程度。但粒子群优化算法搜索速度优于遗传算法,其原因如下。
①无交叉和变异操作,通过随机速度来改变个体位置,计算复杂度比遗传算法低。
②粒子具有“记忆”的特点,通过自学习和向其他粒子学习,能在较短时间找到最优解。
③粒子群优化算法中信息流动是单向的,只有 Gbest 将信息传递给其他的粒子,这样所有粒子都跟随当前最优解快速收敛到全局最优解。
有文献表明,对粒子群优化算法和遗传算法在产生相同的最优解的情况下,前者的计算效率远高于后者。这一假设进行了多次检验,结果显示在8个测试问题中的7个优化问题中,粒子群优化算法的计算效率以99%的置信度高于遗传算法。
由于PSO算法计算量小、收敛速度快、容易实现而又功能强大,适用于实时应用场合,故本研究采用它对SVM的参数进行优化,从而提高短时交通流的预测精度。
本书选用 ε -SVR支持向量机作为预测模型,模型参数惩罚因子 C 、核参数 γ 是影响SVM预测精度的重要参数,用粒子群优化算法来对其进行优化,可以快速得到优化结果,获得高精度的SVM模型。
具体的步骤如下。
以SVM的参数惩罚因子 C 、核参数 γ 组成的向量作为粒子。随机初始化粒子群。
根据粒子 X i , i ∈{1,2,…, M }的惩罚因子和核参数,建立支持向量机模型,每一模型都经过样本数据训练和预测,然后计算适应值。支持向量机预测的目标是尽可能减小预测的均方差 MSE ;但粒子群优化是对适应度函数的最大化进行寻优,因此需要将最小化目标函数 MSE 转化为最大化适应度函数,第 i 个粒子的适应值函数如下式所示
根据适应值更新每个粒子的 Pbest i 、全局最优解 Gbest 及其索引号 g ;
更新每个粒子的速度和位置向量,产生下一代粒子群。
判断是否满足终止条件,若满足则终止,全局最优解即对应最优的支持向量机参数;否则返回。
在执行过程中,粒子个数一般取20~40,取 c 1 = c 2 =2,最大飞行速度向量 v max 根据支持向量机的参数确定。惯性权值 w 用线性递减方式获得。
道路交通状态识别是指通过交通流信息的融合,建立交通流参数模型并结合交通专家知识进行交通拥堵状态判别或交通事件识别的过程。
交通拥堵状态判别就是根据当前的交通流信息,结合交通知识将交通拥挤程度进行等级划分,定量化告诉人们目前的交通拥挤情况。交通拥挤程度是一个模糊的概念,很难用确切的数据来形容一个交通状态是否拥挤,因此可采用模糊推理的方式来评判交通拥堵状态。
模糊推理法的原理是根据交通流量、占有率和交通拥挤状态之间的关系组成模糊规则矩阵,然后利用交通流量、占有率的实测数据作为输入,通过一系列的模糊运算推断出交通拥堵状态。模糊推理的基本算法步骤如下。
把交通流量、占有率两个模糊集合的论域统一定义为:
U 1 = U 2 = U ={“非常小”,“小”,“中”,“大”,“非常大”}={1,2,3,4,5}
把拥堵状态模糊集合的论域定义为:
V ={“畅通”,“正常”,“拥挤”,“堵塞”,“严重堵塞”}={0,1,2,3,4}
交通流量、占有率和拥挤度之间的模糊关系如图2-21所示。
图2-21 交通流量、占有率和拥挤度之间的模糊关系
交通流量和占有率隶属度函数如图2-22所示。
图2-22 隶属度函数
图中, v vs 、 v s 、 v m 、 v l 、 v vl 分别代表“非常小”、“小”、“中”、“大”、“非常大”模糊隶属度的临界值。
第一步:输入值模糊化,根据图2-22所表示的隶属度函数,计算对应的隶属度,然后将隶属度组成模糊集合:
U ={μ vs ,μ s ,μ m ,μ l ,μ vl } (2-60)
μ vs 、 μ s 、 μ m 、 μ l 、 μ vl 分别代表“非常小”、“小”、“中”、“大”、“非常大”隶属度。
第二步:计算模糊关系矩阵,假设每一条模糊规则对应一个模糊关系 R i ( i =1,2,…, n ),则进行模糊关系融合得到模糊关系矩阵
第三步:计算模糊输出
第四步:模糊结果判决。
模糊结果采用重心法进行判决,假设输出模糊集合 V ={ μ 0 , μ 1 , μ 2 , μ 3 , μ 4 },则输出值为
交通事件识别就是利用交通事件发生时的特征和采集到的交通流参数,如车道占有率、平均速度、流量等交通参数,通过一定的检测规则和算法,推断出是否发生交通事件的过程。
交通事件识别方法主要有:①基于状态估计的方法,如1980年Willsky等提出的多重模型法(MM法),它根据观测向量{ y 1 , y 2 ,…, y k }以及一组假设模型,在滤波估计的基础上,判断哪个假设模型的状态估计最接近当前真实系统,就可以判断该假设模型的事件已经发生;②基于模式识别的方法,如美国加利福尼亚州运输部开发的California算法,该算法分别比较上下游相邻检测器获得的占有率的差和相对差以及下游前后时间段占有率相对差值,与事先给定阈值相比较,超出阈值就发出报告,该算法还有一系列改进的算法得到广泛认可和应用;③基于统计预测或者滤波的方法,此算法在以往观测数据的基础上利用统计方法对当前交通状态做出预测,再与实际观测结果相比较,如果差别大于预先给定阈值,就发出事件报告;④基于突变理论的方法,如美国F L.Hall DY.Shi等人于1993年提出的McMaster法,该算法从被检测路段实际交通特性曲线 q = q ( o )(即流量与占有率的函数关系)基础上,把 q-o 分为四个区域,分别对应不同的交通状态,当实测 q 、 o 落入代表拥挤状态的区域而且速度值低于某一下限值,才确认拥挤存在,如果发生拥挤,通过检查下游检测器的交通状态,直到发现一个检测站处于非拥挤状态,则确认那个检测站发生事件;⑤基于神经网络的方法,该算法根据发生和不发生交通事件情况下的交通参数特征,选定学习样本数据和学习时的参数对人工神经元网络进行训练,再输入被检测路段的观测数据,利用训练好的神经网络,得到输出结果,从而判断是否发生事件。
这些算法都有比较成熟的理论做支撑,而且运用也比较广泛,有的算法甚至已经成为评判其它算法好坏的标准,如California算法等,然而这些算法都有着一定的缺陷,有的需要知道一些阈值,如基于统计预测或者滤波的方法、California算法和McMaster法,有的则需要有一些现成的模板,如多重模型法(MM法),还有的则需要大量的历史事件数据和大量时间进行学习,如基于神经网络的方法等。本书提出一种基于概率统计的双变量模型法,这种方法不需要确定阈值、同时也不需要现成的模板以及不需要大量的历史事件数据去学习。
基于概率统计的双变量模型法的原理是根据当事件发生的时候,路段的占有率就会出现显著变化,和正常情况下的占有率会有很大的差异,通过研究和比较正常情况下占有率的分布情况和发生事件情况下占有率的分布情况,得出规律,利用该规律来判断是否发生交通事件。
首先定义两个变量即占有率 O 和相邻间隔时间内的占有率差 DO ,实践表明在无事件的情况下 DO i 和 O i 是二维正态分布的一个样本点,有事件发生的时候 DO i 和 O i 则是正态分布范围之外的一个样本点,因此判断有无事件发生,只需检查样本点是否在二维正态分布覆盖范围之外就可以了。
二维正态分布的概率密度函数为:
式中, μ O 表示占有率的数学期望; μ DO 表示相邻时段占有率差的数学期望。
c 1 =2π σ O σ DO (1- ρ 2 ) 1/2 (2-65)
式中, σ O 表示占有率的标准偏差; σ DO 表示相邻时段占有率差的标准偏差; ρ 表示两者之间的相关系数。
协方差矩阵
式中, σ ODO 为占有率与相邻时段占有率之间的协方差。
相关系数为
该二维正态分布可以用图2-23描述。
图2-23 O-DO 二维正态概率分布
其投影在 O 和 DO 二维坐标系中是一个椭圆
椭圆中心点为( μ O , μ DO ),随着 k 的增加,椭圆的面积也增加, k 等于 时,椭圆范围内将平均包含100(1- α )%的样本点,如果一个点( O i , DO i )位于椭圆范围内,即
那么可以认为未发生事件,如果位于椭圆范围外则认为发生了事件。
历史样本的选取:选择历史上15天正常情况下的占有率数据。
数学期望 μ O 和 μ DO 计算
DO i = O i - O i- 1 (2-71)
标准偏差 σ O 和 σ DO 计算
协方差 σ ODO 计算
计算 k 值
若取置信度为100(1- α )%,当 k ≤ χ α/ 2 2 ( n )时,表示没有发生交通事件;当 k > χ α/ 2 2 ( n )时表示发生交通事件。