陈琼红 1,2 ,冀杰 2
1.重庆智行者信息科技有限公司
2.西南大学工程技术学院
【摘要】 网联自动驾驶技术的快速发展,为解决车辆队列的纵向控制问题提供了有效途径。本文设计了一种面向车辆队列的鲁棒控制器,且将领航车辆的加、减速度作为队列的外部干扰。该控制器根据队列拓扑结构的对称性,将队列控制问题分解为单个车辆的纵向控制,并采用线性矩阵不等式对鲁棒控制器进行求解。利用驾驶人在环测试对设计的鲁棒控制器进行验证,结果表明 : 在受到外部干扰时,跟随车辆均能实现安全稳定行驶,达到提升道路通行效率和车辆行驶安全性的目的,且与BD ( Bidirectional ) 型拓扑结构相比,BDL ( Bidirectional-leader ) 型的车间位置误差更小,跟随车辆的跟驰行为更好。
【关键词】 智能网联车辆,鲁棒控制器,车辆队列,拓扑结构,驾驶人在环
The Robust Cooperative Motion Control for Vehicle Platoon
Chen Qionghong 1,2 , Ji Jie 2
1. Chongqing IDIVERPLUS Information Technology Co ., Ltd .
2. CET-College of Engineering and Technology , Southwest University
Abstract: The rapid development of connected automatic vehicle technology provides an effective way to solve the problem of longitudinal control of vehicle platoon.This paper designs a robust controller for vehicle platoon,and takes the acceleration and deceleration of the leading vehicle as the external disturbance of the platoon.According to the symmetry of the platoon topology,the controller decomposes the platoon control problem into the longitudinal control of a single vehicle,and uses linear matrix inequalities to solve the robust controller.The designed robust controller was verified by driver-in-the-loop test.The results showed that:when subjected to external interference,the following vehicles can achieve safe and stable driving,and achieve the purpose of improving road traffic efficiency and vehicle driving safety.Compared with the Bidirectional topology structure,the Bidirectional-leader topology structure has a smaller workshop position error and better car-following behavior.
Key words: intelligent connected vehicle,robust controller,vehicle platoon,topological structure,driver-in-the-loop
网联自动驾驶车辆队列在缓解道路拥堵、提高行车安全以及降低燃油消耗等方面具有重要影响,因此各国研究学者均对其开展大量的研究工作。
车辆队列控制包含纵向、横向以及横纵向耦合三种方式,本文主要研究车辆的纵向控制,即车辆在平直道路上行驶时,当前方车辆采取加速和减速措施时,跟随车辆通过对加速和制动踏板的控制,使车辆保持期望的车间距离和相对速度的过程。车辆队列的结构模型如图1所示。
图1 车辆队列结构
由图1可知,车辆队列分为车辆节点动力学、车辆队列的几何构型、控制器及拓扑结构 [1-5] 。其中,车辆队列的几何构型决定车辆行驶的跟驰策略形式,主要有恒定车间距、恒定车间时距和变车间时距三种策略;拓扑结构指在车辆队列中各个节点之间实现行驶信息实时交互的方式,主要通过无线通信技术实现;车辆队列控制器主要采用分层控制器,其中上层控制器根据车间距离、相对速度等行驶信息得出车辆节点的纵向期望加速度,常用的控制器包括滑模控制器 [5-10] 、模型预测控制器 [11-17] 、PID控制器 [18-21] 、模糊控制 [22-24] 以及人工势能场 [25-28] 等;下层控制器则基于上层控制器得出的纵向期望加速度,通过车辆的逆向动力学模型对队列中车辆节点运动状态进行控制。本文采用的分层控制器结构如图2所示。
图2 车辆队列控制器
车辆纵向运动指在行驶过程中只与车辆的加、减速相关,而与车辆的转向操作无关的运动。主要涉及车辆的发动机、制动系统、传动系统和车轮等部件。由于车辆为强非线性系统,纵向动力学的建模过程不仅复杂繁琐而且精度较低,因此,需要对车辆进行以下简化假设:
1)当通信延迟小于20ms时,不考虑无线通信技术产生的时间延迟。
2)队列行驶过程中的车队规模保持不变。
3)忽略轮胎的滑移率。
4)每辆车的一阶惯性延时均相同,即为匀质车辆队列。
通过上述假设,建立单个车辆的纵向动力学模型如下:
式中, x i ( t )为车辆位移(m); v i ( t )为车辆速度(m/s); a i ( t )表示车辆加速度(m/s 2 ); m i 为车辆整车质量(kg); η T , i 为传动系统的机械效率; T i ( t )为车辆实际输出的驱动力或制动力矩(N·m); r i 为车轮半径(m); C A , i 为车辆的空气阻力系数; g 为重力加速度(m/s 2 ); f i 为车辆的滚动阻力系数; τ i 表示发动机的一阶惯性延迟的时滞常数; T des , i ( t )为期望的驱动或制动力矩(N·m)。
公式1化简为
式中, u i 为车辆 i 的期望加速度(m/s 2 )。
将领航车辆的加速度作为车辆队列整体的外部干扰,得到车辆节点 i 在 t 时刻的三阶状态空间模型如式3所示:
式中, x i ( t )为车辆节点 i 的当前行驶状态,包含车辆的位移、速度和加速度等状态参数; w i ( t )表示队列的外部干扰,即领航车辆的加速度(m/s 2 ); τ 表示车辆的发动机一阶惯性延迟的时滞常数,取值0.5s。
拓扑结构将代数图论和矩阵论相关知识进行结合,直观地把车辆队列抽象为图结构,并利用矩阵的相关性质对图结构进行定量分析。在车辆队列中,拓扑结构主要用于描述各个车辆节点之间局部控制器的信息传输和交互方式,对队列整体的纵向行驶控制具有重要作用。
本文建立BD型和BDL型两种拓扑结构,相应的队列模型如图3和图4所示。
图3 BD型拓扑结构
图4 BDL型拓扑结构
BD型拓扑结构指在队列中,相邻跟随车辆之间采取双向通信的方式进行行驶状态信息传输,领航车辆向第一辆跟随车进行单向信息状态传递;BDL型拓扑结构与BD型相似,不同的是队列中的每一辆跟随车均能单向接收领航车辆的行驶状态信息。
综上可得,队列中节点 i 的邻域集为
相应的邻接矩阵为
相应的拉普拉斯矩阵为
队列中节点 i 的领航车辆可达集分别为
根据式(7)和式(8)可得,牵引矩阵分别为:
两种拓扑结构下的 L + P 矩阵如下:
在车辆队列中,为了满足队列整体的期望行驶控制目标,利用相邻车辆的行驶状态信息对节点 i 的纵向行驶进行控制。根据队列拓扑结构的定义,得到车辆节点 i 的邻域信息为
队列中跟随车辆行驶的控制目标为
式中, v 0 表示领航车辆的速度(m/s);当 i =1时, x 0 ( t )为领航车辆的位置(m); d i -1, i >0且为车辆节点 i -1与 i 之间的期望车间距离,车辆队列的间距策略采用固定车间距离策略,即 d i , i -1 = d 0 。
根据运动学理论,将车辆队列节点 i 行驶过程中与领航车辆之间的位移、速度及加速度的跟随误差定义如下:
令
k
=[
k
p
,
k
v
,
k
a
]
T
,
X
i
=
,将拓扑结构和期望控制目标相结合,得到车辆
i
的期望加速度如下:
车辆队列整体的期望加速度如下:
式中,符号“⊗”表示Kronecker积;
L
和
P
表示拓扑结构对应的拉普拉斯矩阵和牵引矩阵。
X
为跟随车辆的状态误差矩阵,即
将三阶状态空间模型和期望加速度相结合,得到车辆队列整体的纵向闭环动力学模型如下式:
式中, B = I N ⊗ B 2 ,且 I N 为 N 维的单位矩阵, W =[ w 1 , w 2 , w 3 ,…, w N ] T 为车辆队列的外部干扰向量,即车辆队列中领航车辆的加速度。
令 A c = I N ⊗ A -( L + P )⊗ B 1 k T ,可将队列纵向闭环动力学模型化简为
式中, A c 为队列的闭环系统特征矩阵。
鲁棒控制器的输出为跟随车辆的位置跟踪误差,其定义如下:
式中, C = I N ⊗ C 1 ,其中 C 1 =[1,0,0]。
根据车辆队列闭环纵向动力学方程,得到鲁棒控制器的外部输入干扰 W 到输出的位置跟踪误差 Y 之间的传递函数如下:
式中, s 为复变量。
将 A c 、 B 和 C 带入式(21),得到传递函数如下:
式中, K = k p + k v s + k a s 2 。
根据车辆动力学原理及车辆行驶的舒适性条件,当在良好的路面上行驶时,车辆的动力系统及制动系统所能提供的最大加速度和最大减速度均在一定范围内。因此,当鲁棒控制器的外部干扰为领航车辆的加速度或减速度时,在数学表达上可以将该干扰表示为有界函数,即能量是有限的,在范数上可表示为外部干扰 w i 的 L 2 范数有界,其表达式如下:
当采用线性鲁棒控制中的 γ 增益来衡量车辆队列整体的性能时,可表示为
式中, Y ( t )为车辆队列的位置跟踪误差向量; W ( t )为鲁棒控制器的外部干扰向量;“sup”表示上确界即最小上界。
由式(24)可知, γ 增益的上界即为车辆队列闭环传递函数的 H ∞ 范数,如下:
式中, σ max (·)表示传递函数 G ( jω )的最大特征值。
根据拓扑结构的对称性,将队列整体的纵向控制按照单个车辆节点进行解耦,通过控制单个车辆实现队列整体的纵向控制目的。因此,必然存在一个正交矩阵 V ∈R N × N 且 VV T = I N ,使得:
式中, Λ 为对角矩阵,其对角元素为矩阵 L + P 的 N 个特征值; λ i 为矩阵 L + P 的第 i 个特征值。
根据对称矩阵对角化的性质,可将车辆队列的闭环传递函数表示为下式:
将闭环传递函数进一步简化:
式中,
。
由此得到 γ 增益的上界为
式中,符号“(·) * ”表示共轭复数;max为最大值函数。
为了达到鲁棒控制器输出位置误差最小的目的,车辆队列的闭环传递函数需满足以下条件:
1) G ( s ) H ∞ →0。
2)当外部干扰响应的衰减率小于给定的数值
γ
d
时,需满足
G
(
s
)
H
∞
<
γ
d
且
γ
d
>0,由此推出
。
通过有界实引理将 H ∞ 范数指标转换为线性矩阵不等式(LMI,Linear Matrix Inequalities),在利用线性矩阵不等式求解车辆队列的鲁棒控制问题之前,需要引入如下定理:
定理1:根据闭环传递函数和有界实引理,得到 H ∞ 控制有解的充要条件为:闭环传递函数 G ( s ) w 的实现为( G ( s ) w ) H ∞ < γ d 且 G ( s ) w =( A w , B w , C w , D w ), γ d >0,存在一个正定矩阵 P >0,使得下式成立:
定理2(Schur引理):将埃尔米特阵
S
=
S
T
写为分块阵形式:
,当
S
11
、
S
22
为方阵时,矩阵
S
>0成立的充要条件是以下条件之一成立:
1)当
S
11
>0时,
>0。
2)当
S
22
>0时,
>0。
车辆队列中节点 i 的三阶状态空间模型和位置跟踪误差如式(33)和式(34)所示:
令 A ci = A-λ i B 1 k T ,得到单个车辆节点鲁棒控制器的 γ 增益为:
根据定理1,得到车辆队列的控制器可解的充要条件为:存在一个正定矩阵 P >0和 γ d >0,使得下列不等式成立:
根据定理2,可将式(36)转换为矩阵不等式:
将矩阵不等式的两边分别左乘和右乘 P -1 ,则式(37)化简为
令 Q = P -1 ,可得:
因
A
ci
=
A-λ
i
B
1
k
T
,令
,将式(39)转换为如下不等式:
反向运用定理2,将式(40)转换为下式:
利用MATLAB的LMI工具箱进行求解,令 γ d =1得到鲁棒控制器的反馈增益为 k T =[1.2784,2.3511,2.1802],相应的可行性解为如下矩阵:
车辆队列在真实场景的落地过程中,借助车辆动力学仿真软件和数值计算软件对设计的鲁棒控制器进行验证,不仅能够降低研发成本还能缩短产品的研发周期。除此之外,在控制器模型未得到全面验证之前,进行实地车辆队列测试易发生不可控制的碰撞事故,因此,针对设计的鲁棒控制器进行驾驶人在环测试具有重要意义。
驾驶人在环测试的软硬件主要包括MATLAB/Simulink、PreScan、CarSim及Logitech G29等。CarSim主要为队列中的车辆提供精确的车辆动力学模型,包括车辆的动力传动系统及相应的接收器、激光雷达、毫米波雷达及相机等传感器,实现不同测试场景搭建;MATLAB/Sim特性参数,提供车辆纵向控制过程中节气门开度和制动压力的输入接口;PreScan则基于CarSim提供的车辆动力学系统建立符合车辆行驶需求的道路、周围建筑、行人和车辆等模型,除此之外,还提供了GPS、DSRC发送器,ulink主要提供车辆队列纵向控制器的建模及相关数值运算;Logitech G29驾驶人模拟器为PreScan中建立的车辆模型提供了外接的转向盘、可调式脚踏板、变速杆及驾驶人座椅,实现驾驶人的驾驶行为模拟。利用联合仿真平台实时生成仿真实验数据及驾驶场景动画,以便驾驶人对当前路况进行实时分析,并采取相应的加减速措施。
本文搭建由5辆跟随车辆和1辆领航车辆组成的乘用车队,队列的初始条件为:车间距离为30m,速度为72km/h且道路为平直无坡度的沥青路面,得到驾驶人在环测试平台及其结构如图5和图6所示。
图5 驾驶人测试平台
图6 测试平台结构
针对建立的驾驶人在环测试模型,设定车辆队列中领航车辆的速度和加速度如图7所示。
图7 领航车辆行驶状态
由图7知,领航车辆先以20%的节气门开度行驶20s,然后维持20s的匀速行驶,再以0.3MPa的制动压力使车辆进行减速行驶,最后车辆以66km/h的速度匀速行驶。
本文分别对以下两种拓扑结构进行驾驶人在环测试:
1)BD型:当领航车辆按照图7行驶时,得到鲁棒控制器的输出状态和车辆实际行驶状态分别如图8和图9所示。
由图8可知,在BD型拓扑结构下,鲁棒控制器能够消除外部干扰引起的队列行驶状态变化,且跟随车辆的理想位置误差范围为[-13.55,7.6]。经过88s后,队列整体趋于稳态行驶,此时跟随车辆的理想速度为66km/h,理想位置误差为0m。
图8 鲁棒控制器输出结果
由图9可知,在领航车辆加速度的扰动下,通过分层控制器对车辆节点进行纵向控制,得到跟随车辆的实际位置误差范围为[-13.41,7.8]。经过88s后,队列逐渐趋于稳定行驶,最终跟随车辆以66km/h的速度对领航车辆进行跟随,且车间距离跟随误差为0.015m。
2)BDL型:当领航车辆按照图7行驶时,在BDL型拓扑结构下,得到队列的鲁棒控制器输出状态和车辆实际行驶状态分别如图10和图11所示。
图9 车辆实际行驶状态
图10 鲁棒控制器输出结果
图11 车辆实际行驶状态
根据图10的结果可知,在BDL型拓扑结构下,鲁棒控制器能够消除外部干扰引起的队列行驶状态变化,且跟随车辆的理想位置误差范围为[-0.706,0.4]。经过61s后,队列趋于稳态行驶,此时跟随车辆的理想速度为66km/h,理想位置误差为0m。
由图11可知,在领航车辆加速度的扰动下,通过分层控制器对车辆节点纵向控制,得到车辆的实际位置误差范围为[-0.49,0.55],经过61s后队列逐渐趋于稳定行驶,最终跟随车辆以66km/h的速度对领航车辆进行跟随,且车间距离跟随误差为0.357m。
综上所述,鲁棒控制器能够保证车辆队列在外部干扰下实现稳定安全的行驶,且BDL型拓扑结构的车间位置误差更小,收敛速度更快。
本文针对车辆队列纵向控制问题提出鲁棒控制器,并利用驾驶人在环平台进行测试验证。结果表明在受到外部干扰时,设计的鲁棒控制器仍能保证跟随车辆对领航车辆的安全跟随,且在BDL型拓扑结构中,车间位置误差最小,跟随车辆的跟驰效果更好,最终实现降低碰撞事故发生率和提升道路通行效率的目的。由于未考信通信延时与丢包问题,因此在后续的研究中应考虑通信因素。
[1]郑洋.基于四元素构架的车辆队列动力学建模与分布式控制[D].北京:清华大学,2015.
[2]ZHENG Y,LI S E,LI K Q,et al.Stability Margin Improvement of Vehicular Platoon Considering Undirected Topology and Asymmetric Control[J].IEEE Transactions on Control Systems Technology,2016,24:1253-65.10.1109/Tcst.2015.2483564
[3]SWAROOP D,HEDRICK J K.Constant spacing strategies for platooning in Automated Highway Systems[J].Journal of Dynamic Systems Measurement and Control-Transactions of the Asme,1999,121:462-70.Doi 10.1115/1.2802497
[4]STANKOVIC S S,STANOJEVIC M J,SILJAK D D.Decentralized overlapping control of a platoon of vehicles[J].IEEE Transactions on Control Systems Technology,2000,8:816-32.Doi 10.1109/87.865854
[5]DI BERNARDO M,FALCONE P,SALVI A,et al.Design,Analysis,and Experimental Validation of a Distributed Protocol for Platooning in the Presence of Time-Varying Heterogeneous Delays[J].IEEE Transactions on Control Systems Technology,2015,24:1.10.1109/tcst.2015.2437336
[6]HEDRICK J K,MCMAHON D,NARENDRAN V,et al.Longitudinal vehicle controller design for IVHS systems[C]// 1991 American Control Conference,F,1991.IEEE.
[7]MCMAHON D H,NARENDRAN V,SWAROOP D,et al.Longitudinal vehicle controllers for IVHS:Theory and experiment[C]// 1992 American Control Conference,F,1992.IEEE.
[8]任殿波,张继业,李维军.基于滑模控制的时滞自动车辆跟随系统数学模型[J].公路交通科技,2008,142-5.
[9]王庞伟,余贵珍,王云鹏,等.基于滑模控制的车车协同主动避撞算法[J].北京航空航天大学学报,2014,268-73.
[10]陈明哲.混合交通工况下的商用半挂车纵向协同自适应巡航控制[D].重庆:西南大学,2019.
[11]陈明哲,冀杰,唐志荣,等.商用半挂车队列纵向运动协同控制及仿真[J].重庆大学学报,2018,41:39-47.
[12]LU X Y,WANG J,LI S E,et al.Multiple-vehicle lon gitudinal collision mitigation by coordinated brake control[J].Mathematical Problems in Engeering,2014:13.
[13]WANG J Q,LI S E,Zheng Y,et al.Longitudinal collision mitigation via coordinated braking of multiple vehicles using model predictive control[J].Integrated Computer-Aided Engeering,2015,22:171-185.
[14]胡满江,徐彪,秦洪懋,等.基于MPC的多车纵向协同避撞算法[J].清华大学学报(自然科学版),2017,57:1280-6.
[15]孙涛,夏维,李道飞.基于模型预测控制的协同式自适应巡航控制系统[J].中国机械工程,2017,28:486-91.
[16]孙小雨.基于模型预测控制的车辆协同式自适应巡航控制[D].哈尔滨:哈尔滨工业大学,2018.
[17]徐成.部分车辆联网条件下多车协同避撞算法研究[D].北京:清华大学,2015.
[18]SHLADOVER S E.Longitudinal control of automated guideway transit vehicles within platoons[J]ASME J Dyn,Sys,Meas,Control,1978,100(4):302-310.
[19]SHLADOVER S E.Longitudinal control of automotive vehicles in close-formation platoons[J].ASME J Dyn,Sys,Meas,Control,1991,113(2):231-241.
[20]ZHANG J,LI Z,MENG W,et al.The PID Algorithm for Multi-vehicles Cruise Control in Platoon[J].Journal of Information & Computational Science,2015(12):3899-906.
[21]KAROUI O,KHALGUI M,KOUBÁA A,et al.Dual mode for vehicular platoon safety:Simulation and formal verification[J].Information Science 402,2017,402:216-32.
[22]XIAO L,GAO F.Practical string stability of platoon of adaptive cruise control vehicles[J].IEEE Transactions on Intelligent Transportation Systems,2011,12:1184-94.
[23]GUO G,YUE W.Autonomous platoon control allowing range-limited sensors[J].IEEE Transactions on vehicular technology,2012,61:2901-12.
[24]OLIVARES-MENDEZ M A,CAMPOY P,MELLADO-BATALLER I,et al.Autonomous guided car using a fuzzy controller[M].Berlin:Springer.2013:37-55.
[25]陈康,游峰,李耀华.基于心理场理论的高速公路弯道路段车辆跟驰建模与仿真[J].交通信息与安全,2016,34:77-82.
[26]李林恒,甘婧,曲栩,等.智能网联环境下基于安全势场理论的车辆跟驰模型[J].中国公路学报,2019,32:76-87.
[27]陶鹏飞,金盛,王殿海.基于人工势能场的跟驰模型[J].东南大学学报(自然科学版),2011,41:854-8.
[28]张玲玲,贾元华,曹瑾鑫.基于人工势场的交叉口车辆集聚模型[J].北京交通大学学报,2012,36:117-21+27.
乔旭强,任玉庆,郑玲,李以农,李剑辉,张紫微
重庆大学机械与运载工程学院
【摘要】 针对驾驶人风格评价指标多、难以量化等问题,本文中提出了一种基于驾驶模式语义平面的驾驶风格评估方法。首先,基于驾驶模拟仿真平台采集了驾驶人跟车驾驶数据及主观问卷评分表,利用K-means算法对驾驶人主观评分进行聚类分析,初步对驾驶人风格进行评估 ; 接着基于HDP-HSMM非参贝叶斯算法,采用弱极限吉布斯采样器 ( Weak-limited Gibbs sampler , WLGS ) 对模型参数进行采样,对驾驶过程进行建模,并对驾驶模式进行切割,获得具有不同数据特征的驾驶时序数据片段,基于模式层指标及操作层指标构建驾驶模式语义平面,通过语义平面获取各模式出现的频次及时间占比,基于客观驾驶数据对驾驶人风格进行量化评估。分析结果显示,主观评分与客观评分Pearson相关性系数达到0.84,表明主观分析与客观分析具有强相关性,所提出方法能够对驾驶风格进行风险量化评估。并且该方法扩展性强,可以进一步对驾驶模式之间的转移频率进行分析,该方法为驾驶人风格分析提供一种新思路。
【关键词】 驾驶风格,驾驶模式语义平面,智能汽车,拟人化
Research on Driver's Style Based on Driving Maneuver Semantic Plane
Qiao Xuqiang, Ren Yuqing, Zheng Ling, Li Yinong, Li Jianhui, Zhang Ziwei
College of Mechanical and Vehicle Engineering , Chong Qing University
Abstract: Aiming at the problem that there are many evaluation indexes for driver's style and it is difficult to quantify, a driver's style evaluation method based on driving maneuver semantic plane is proposed. Firstly, the driver's following driving data and subjective questionnaire score are collected based on the simulation platform. The K-means algorithm is used to cluster analysing the driver's sub-jective score, so as to preliminarily evaluate the driver's style. Then the driving time series data fragments with different data character-istics are obtained based on the nonparametric Bayesian algorithm, i. e., the HDP-HSMM which the parameters are sampled by Weak-limited Gibbs sampler (WLGS). The mode level indicators and operation level indicators are applied to construct the driving maneuver semantic plane. The frequency and time proportion of each maneuver are obtained through the semantic plane, and the driver's style is quantitatively evaluated based on the objective driving data. The results show that the Pearson correlation coefficient of subjective score and objective score is 0.84, which indicates that there is a strong correlation between subjective analysis and objective analysis, and the proposed method can quantify the risk of driving style. Moreover, this method has strong expansibility, and can further analyse the trans-fer frequency between driving modes. This method provides a new idea for driver style analysis.
Key words: driving style,driving maneuver semantic plane,intelligent car,humanization
近年来自动驾驶汽车因为其安全、节能、环保等特点而受到国内外研究学者的广泛关注 [1] 。驾驶风格的研究对于提高道路安全及提高驾驶人对智能汽车的接受度具有重要意义。一方面,在人-车-道路交通环境三者构成的道路交通系统中,机动车驾驶人是最为薄弱的一个环节 [2] ,研究表明激进型风格的驾驶人在驾驶过程中容易出现急加速、急减速,近距离跟驰以及频繁变换车道的不良行为,通过对驾驶人不良行为进行规范和预警,有利于提高车辆的驾驶安全性 [3] 。另一方面,不同风格的驾驶人对车辆的各项性能有个性化的需求,如针对不同风格的驾驶人,文献[4]根据不同的驾驶风格设计了个性化的ACC(Adaptive Cruise Control)以满足驾驶人个性化跟车需求,文献[5]通过采集不同风格驾驶人的换道特性,设计个性化的换道策略以满足个性化的换道需求。因此,为了提高道路交通的安全性及提高车辆舒适性、类人性,有必要对驾驶人风格量化问题进行研究。
目前,针对驾驶风格的评估主要分为主观评估和客观评估2种。主观评估主要通过设计驾驶行为问卷以及危险感知问卷,驾驶人根据自己平时驾驶经验进行填表,采集驾驶人主观特性数据,最后根据总得分对驾驶人风格进行评估 [6] ,该方法简单、直观且容易实施,但该方法受一定主观因素和外界因素的影响,对驾驶问卷的有效性要求较高。驾驶风格客观评估主要通过驾驶模拟器或者实车道路试验采集大量驾驶人行车数据 [7] ,通过提取数据特征对驾驶风格进行分析,该方法基于客观数据进行评测,数据可靠性强,可直观反映驾驶风格的表现特性,是目前研究人员常采用的方法。文献[15]基于实车驾驶数据,提出基于驾驶模式转移概率评测驾驶风格,结果表明,该方法比采用传统的驾驶模式频率方法识别准确率更高,MUOZ [8] 等指出如果在驾驶模式转移概率的基础上加入驾驶人生理指标数据,驾驶风格评估更加准确。
驾驶人风格的研究可以通过图1所示的结构体系进行表征 [7] 。通常情况下,一段驾驶过程可分为驾驶主任务及驾驶次任务 [6] ,驾驶主任务是指为到达预期目的地而进行了一系列操作,如驾驶人通过获取环境信息(感知层),做出路径规划(决策层),通过不断调整车辆状态(模式层,操作层)从而安全高效地到达目的地,驾驶次任务是指在驾驶过程中完成的非必要性动作,如抽烟、打电话、发短信、吃东西等行为。驾驶风格可通过以上的每一个层级进行表现,例如,不同风格的驾驶人在感知层反映为换道前后视觉特性扫视区域差异性,重点区域不一致,视线偏移特性等 [10] ;在决策层级上表现为省时或者省距的抉择偏好 [11] ;在模式层表现为频繁换道、近跟随、远跟随等行车模式偏好 [12] ;在操作层表现为匀加速、急加速,是否及时开启转向灯等操作方式偏好 [13] 。
图1 驾驶风格研究体系架构图
本文主要针对模式层和操作层展开研究。为了准确高效地对驾驶人风格进行分析量化,提出一种基于驾驶模式语义平面的驾驶风格分析方法,以模式层指标THW及操作层指标构建驾驶模式语义平面,基于驾驶数据自身特征,利用HDP-HSMM算法,对驾驶模式进行切割,通过统计各个模式出现在语义平面的概率及时间占比对驾驶风格进行量化评估。
本文基于仿真驾驶模拟器搭建驾驶数据采集平台,如图2所示。通过驾驶模拟器搭建城际高速跟车场景,主要采集驾驶人操作信息、主车行驶状态信息、他车状态信息;利用BioRadio无线生理测量仪搭建生理指标采集系统,采集驾驶过程中驾驶人生理指标信号(ECG,EEG,GSR等)。
按照国家道路标准搭建了高速跟车驾驶场景,如图3所示。前车设置20~80km变速区间,驾驶主任务为主车跟随前车行驶。为了增加驾驶人认知负荷,使驾驶人进行分心驾驶,设计了不同难易程度的驾驶次任务,即N-Back实验,采集了驾驶人在不同认知负荷下的生理指标及车辆状态指标,课题组前期对驾驶认知负荷展开研究,详细内容请参考文献[14]。本文重点在于基于驾驶模式转移特性对驾驶人风格进行研究,不对生理指标展开研究,不考虑认知负荷对驾驶风格的影响。实验数据利用基准实验部分数据以及自由驾驶后半段数据,如图4所示。
图2 驾驶数据采集系统架构
图3 跟车驾驶场景
实验总共招募了33名具有中国机动车驾驶执照、持照1年以上、身体健康的受试者。在正式测试之前,驾驶人先对实验平台进行一段时间的试驾驶,以使他们熟悉车辆和实验步骤。为了消除随机性误差,基准实验和N-Back实验均进行三次采样,实验过程如图4所示。
图4 实验过程
试验过程中采集的试验数据包括驾驶人风格问卷调查评分(6级Likert量表)、自车状态信息、他车状态信息、驾驶人操作信息、生理状态信息等。问卷调查表包括:驾驶行为问卷(Driver Behaviour Questionnaire,DBQ)以及危险感知问卷(Risk Perception Questionnaire,RPQ)。详细的采集信息见表1。
表1 数据采集信息
为了对驾驶人风格进行分类,统计每个驾驶人问卷得分,根据得分高低将驾驶人分为三类:谨慎型、一般型、激进型。对DBQ及RPQ得分进行克朗巴哈(Cronbach's al-pha)信度分析,检验问卷调查结果的信度,两类问卷的信度分别为0.841及0.815,一般信度达到0.70就可接受,介于0.70~0.98均属高信度,分析表明所设计的问卷内容是合理可靠的。根据每个驾驶人两类表格综合得分,并将得分换算成10分制,得分越高,表明驾驶风格越激进,利用k-mean聚类算法对33名驾驶人得分进行聚类分析,最终得到16位一般型驾驶人、7位谨慎型驾驶人、10位激进型驾驶人,见表2。
表2 驾驶人信息统计
车辆状态指标包括自车与他车行驶状态信息,包括自车纵横向速度/加速度,两车之间相对距离,相对速度,THW(time headway),TTC(time to collision)等。THW的计算方式如图3所示,其包含了两车纵向位置信息、自车速度信息,常用于表征驾驶模式及驾驶风格 [15] ,自车加速度则直接表达了驾驶意图及驾驶表现,常用于表达驾驶人加速/减速激励程度。文献[16]用THW和加速度定义了纵向驾驶模式,基于此,本文采用THW和纵向加速度表征跟驰工况下的驾驶模式。
表3定义了各驾驶模式及对应的阈值范围 [15][17] ,根据THW的阈值范围将驾驶模式分为四类,分别是近距离跟随(NF),中距离跟随(MF),远距离跟随(FF);根据加速度阈值范围将操作模式分为四类,分别是急加速(AA),正常加速(NA),正常减速(ND),急减速(AD)。最终总共获得3×4=12种驾驶模式,如AA>0.2m/s 2 ,THW<0.1s,驾驶模式语义定义为:急加速近距离跟驰(AANF)。其他驾驶模式同理可得。
表3 变量阈值
驾驶过程是驾驶人针对外界环境变化不断调整转向盘,制动/加速踏板使车辆状态满足当前环境的过程。在驾驶过程中驾驶模式和和车辆状态指标均具有动态随机性,可看作两个随机过程。隐马尔可夫模型(Hidden Markov model,HMM)由两个随机过程组成,具备较强的动态描述能力,被广泛用于驾驶人动态行为建模 [18] 。但是HMM有两个明显缺点:必须指定隐状态数;状态驻留时间限制不适用于真实数据分布。针对HMM的缺陷,本文引入层狄利克雷过程-半隐马尔科夫模型(Hierarchical Dirichlet Process-Hidden semi-Markov Model,HDP-HSMM),利用HDP良好的聚类特性和分层共享原理为HMM模型提供先验与隐状态数,因此HDP-HSMM具备HDP自动生成聚类数目实现聚类功能和HMM描述动态随机过程 [19] ,且克服了HMM状态持续时间与真实不符的特点,能够有效地对时序数据进行处理,对驾驶状态进行切割。
将驾驶过程看作由驾驶模式(隐状态)与观测状态组成,利用HSMM对驾驶过程进行描述。如图5所示为HSMM的有向图结构,
z
s
表示隐状态,以
D
s
表示每个隐状态的持续时间,
则为每个状态下的观测值序列。HSMM由下式描述:
式中 π 0 为初始状态概率分布; π ij 为状态转移概率矩阵,表示从驾驶模式 i 转移到 j 的概率; D s 为 g ( ω s )为特定于状态 z s 的持续时间 D s 的分布; ω s 为该分布的先验参数; y t 为观测序列发射概率,服从 F 分布。由于HSMM每个隐状态引入持续时间分布,改善了HMM存在的第二个问题。
图5 HSMM的有向图模型
Dirchlet过程(Dirchlet process,DP)是一个随机过程,可以认为是关于无限多个类别的离散分布上的分布,能实现数据的聚类和分布参数的估计 [20] 。HDP是DP的多层子扩展,至少包含两层DP,可以用于复杂多变的状态推断和贝叶斯混合,HDP可为HSMM提供状态数及模型参数的先验。对于DP有如下定义:
对测度空间 Θ 的有限划分 A 1 , A 2 ,…, A k ,假设 G 0 是测度空间 Θ 上的随机概率分布,有以下关系:
则 G 0 服从由基分布 H 和Concentration参数 γ 组成的DP:
式中, θ k 为服从基分布 H (·)的位置点; β ~GEM( γ )表示权重系数的构造关系(GEM分别为Griffiths,Engen,and McCloskey首字母 [21] ,指Sticking-breaking过程); δ θ 为狄克拉函数,满足式(4)
本文使用的HDP由两层DP构成,描述为
式中, γ , α 分别是第一层DP和第二层DP的Concentration参数; G 0 是来自第一层DP的离散分布; G j 是来自第二层DP的离散分布, θ k , H , β , π j 定义与式(3)类似。
根据以上描述,HSMM能对驾驶过程进行建模,对时序数据进行标记,HDP能根据数据本身进行自适应聚类,构造HDP-HSMM可以表达为如图6所示。
图6 HDP-HSMM的有向图模型
图6可表示为
式中,
~GEM(
γ
)指Sticking-breaking过程;
π
i
为隐状态序列
z
s
的分布参数,即HDP为HSMM提供无限状态数;
D
s
是分布参数为
ω
的状态序列长度分布;
y
ts
为分布参数为
θ
i
的观测序列。
在非参数贝叶斯模型中,Gibbs采样算法经常用于模型推理。在确定模型结构之后,本文采用弱极限吉布斯采样器(Weak-limited Gibbs sampler,WLGS)对模型参数进行采样。弱极限近似使无限维隐状态转化成为有限维形式,从而根据观测数据对隐藏状态链进行采样更新。为了便于描述,当某一变量上标或者下标出现“\”时,表示对应的变量从集合中移除。为了简化推导,方便积分求解,假设基分布 H (·)与观测序列分布 F (·)为共轭分布,时间序列分布为 g (·)为Poisson分布,且时间序列分布与观测序列分布独立。则有如下采样过程。
1)首先对 β 进行采样:
2)然后对状态序列分布参数 π i 进行采样:
3)根据观测数据对状态序列 z s 进行采样:
4)根据观测数据对 θ i 、 ω i 进行采样,假设观测数据服从多元高斯分布,则其参数 θ i =( u i ,Σ i )服从Normal-Inverse-Wishart distribution(NIW)分布:
Poisson分布的参数 ω i 服从Beta分布:
5)参数更新,最终模型中的参数包括 ϕ ={ μ 0 , κ 0 , v 0 , S 0 , η 0 , σ 0 }, μ 0 和 S 0 分别是先验均值和先验协方差矩阵, ν 0 与Δ 0 分别为IW分布的自由度和尺度矩阵, η 0 和 σ 0 是Beta初始参数。根据观测数据对参数进行更新,详细更新过程参考文献[22-23]。
提取所有驾驶人跟车工况下的THW及加速度,基于“3倍sigma”准则剔除异常数据,即某一观测数据 y i 与其均值之差大于3倍标准偏差 σ 时,则剔除该数据。为了消除量纲对分析结果的影响,对数据进行归一化处理:
然后,基于WLGS对HDP-HSMM模型中的所有参数进行推断,图7为各驾驶人样本对数似然值随着迭代次数的增加而变化的情况,从图中可以看出,在采样循环至100次左右时,对数似然开始趋于稳定。
为便于展示驾驶模切割结果,以5号驾驶人一次时长30s的跟车行驶数据分割为例,其切割结果如图8所示。
图7 所有驾驶人训练过程对数似然值
图8 5号驾驶人一个跟车事件实验数据驾驶模式切割结果展示
图8a表示从驾驶时序数据中识别出的驾驶模式序列。相同颜色和数字表示数据表示同一种驾驶模式,如数字0和数字19分别代表两种不同的驾驶模式,对应到图8b和图8c中,可以发现对应的THW及加速度具有相似的特征,如对于“0”驾驶模式,对应的THW在2s附近,加速度在0.5m/s 2 左右,对于“19”驾驶模式可以得出类似的结论。另外,每一种驾驶模式的持续时间各不相同,驾驶模式和观测变量具有随机性,体现出HSMM能够较好地对驾驶过程进行建模,HDP-HSMM能够对驾驶过程进行较好的模拟,且能够在不受主观干预的情况下,从较长的时间序列中自动根据数据特征,对驾驶模式进行识别,并将具有相似特征的数据片段自动归为一类。
虽然HDP-HSMM能有效地对驾驶过程进行切割,但是切割出来的数据还是一串时序数据,很难量化驾驶人风险系数。如图9所示,图9为THW和加速度的散点图,例如模式“16”的THW比模式“0”大,表明模式“16”比模式“0”更加安全,然而,模式“16”加速度比模式“0”大,意味着前者又比后者更加危险,这类矛盾导致很难量化两种模式之间的风险系数。为此本文提出了基于驾驶模式语义平面的驾驶风格分析方法,详见下一小节。
图9 5号驾驶人数据散点图
根据表3定义的变量阈值,将驾驶模式分为4×3=12种,图10a为驾驶模式评估模型,颜色越鲜艳表示风险系数越高,冷色调代表风险系数低。图10b为驾驶模式语义平面,图中 i-j-k 表示驾驶模式之间的相互转移,本文的重点在于对驾驶风格的量化评估,驾驶模式之间的转移概率特性分析作为后期研究工作。对于语义平面有如下解释,NF-AA:近距离急加速跟驰;FF-AD:远距离急减速跟驰,其他驾驶模式以此类推。图10a中对各个驾驶模式进行了风险系数定义,最大风险驾驶模式为NF-AA,风险系数为10分,最小风险驾驶模式为FF-AD,风险系数为3分,笔者认为即使是驾驶经验丰富的驾驶人也可能发生交通事故,具备一定风险。
图10 驾驶模式语义平面示意图
为了将各个驾驶模式分配到驾驶模式语义平面,本文利用K-means聚类方法对驾驶模式进行聚类,并将聚类参数设置 K =1,这样每一个驾驶模式可以聚成一个点,从而根据驾驶模式语义平面进行归属判定,图11所示为图8(或图9)各个驾驶模式语义平面判定结果。
图11 使用K-均值算法( K =1)对5号驾驶人跟车事件原语的聚类与标记结果
由上图可知,驾驶模式“16”被判定为FF-NA,驾驶模式“0”被判定为MF-NA和FF-NA,由于每一种驾驶模式都定义了得分,所以根据驾驶模式语义平面可以对驾驶人进行定量的驾驶风险评估。
通过统计一段时间或者一定里程各个驾驶模式在语义平面上的分布,可以对单个驾驶人驾驶风格进行量化分析。本文基于前者进行驾驶人风险量化。主要考虑每种模式出现的频次以及时间占比,单一地考虑驾驶模式出现次数,难以准确地对驾驶风格进行描述。
每种驾驶模式出现频次计算公式见式(14):
时间占比计算公式见式(15):
式中, i ∈[AA,NA,ND,AD]; j ∈[NF,MF,FF]; N ( i , j ) 则表示对应模式出现的次数; T ( i , j ) 表示对应模式出现的时间。最终总得分为
式中,
为每个行为的计分标准(见图10a);
ω
为权重系数,满足
ω
1
+
ω
2
=1,本文中取
ω
1
=
ω
2
=0.5。
图12为5号驾驶人所有数据的模式频率及每种模式的时间占比,根据式(14)~式(16),能够容易地对驾驶风险进行量化。
图12 a)驾驶模式频率和b)驾驶模式时间百分比示意图
由图12可知,某驾驶模式出现的频率高不能代表其总体占有的时间长,进一步说明考虑时间占比是合理的,基于驾驶语义平面5号驾驶人的最终得分为5.63,根据最终所有驾驶人得分,可以得出5号驾驶人驾驶风格为谨慎型。
根据式(14)~式(16),可得到每个驾驶人的客观风险指数,为了验证所提出方法的合理性,将前小节主观评价分数与客观风险系数进行Pearson相关性分析,设置显著性水平为0.05,分析结果如图13所示,结果显示主观驾驶风格评分普遍高于客观风险系数得分,可能的原因为驾驶人对自己的驾驶技术充满自信,具有一定主观性。主观驾驶风格评分与客观风险系数得分相关性系数为0.81,对应的显著性水平 p =0,表明两个变量总体趋势具有一致性,显著相关,具有正相关性。另外利用K-mean算法对客观风险系数进行标记,标记结果显示,有5名驾驶人标记错误,标记准确率达到84.8%。以上分析结果验证了所提出的驾驶风格量化方法的可行性和准确性,驾驶语义平面可用于对驾驶风格进行分析。
图13 驾驶风格主观评分与客观风险系数相关性分析
针对驾驶风格量化评估问题,本文提了一种基于驾驶模式语义平面的评估方法,首先基于驾驶模拟仿真平台采集了驾驶人跟车驾驶数据及主观问卷评分表,利用K-means算法对驾驶人主观评分进行聚类分析,初步对驾驶人风格进行评估;基于HDP-HSMM非参贝叶斯算法,对驾驶过程进行建模,有效地识别出不同参数特征下的驾驶模式,合理地对驾驶过程进行切割。在此基础上提出了基于驾驶模式语义平面的驾驶风格量化框架,分析结果显示,该方法能够有效地对驾驶人进行风险量化评估,并且该方法扩展性强,可以进一步进行驾驶模式之间的转移频率分析,该方法为驾驶人风格量化分析提供一种新思路。
[1]CAO H T,ZHAO S,SONG X L,et al.An optimal hierarchical framework of the trajectory following by convex optimization for highly automated driving vehicles[J].Vehicle System Dynamics,2019,57(9):1287-1317.
[2]廖源.基于多源信息组合的驾驶人分心监测研究[D].北京:清华大学,2015.
[3]曾诚,蔡凤田,刘莉,等.不同驾驶操作方法下的汽车运行燃料 消耗量分析[J].交通节能与环保,2011(1):31-34.
[4]ZHU B, JIANG Y, ZHAO J, et al.Typical-driving-style-oriented Personalized Adaptive Cruise Control design based on human driving data[J].Transportation Research Part C:Emerging Technologies,2019,100(MAR.):274-288.
[5]YANG W,ZHENG L,LI Y,et al.Automated Highway Driving Decision Considering Driver Characteristics[J].IEEE Transactions on Intelligent Transportation Systems,2020,21(6):2350-2359.
[6]张磊,王建强,杨馥瑞,等.驾驶员行为模式的因子分析和模糊聚类[J].交通运输工程学报,2009,009(005):121-126.
[7]CHEN S W,FANG C Y,TIEN C T.Driving behaviour modelling system based on graph construction[J].Tramsportation Research Part C Emerging Technologies,2013,26(JAN.):314-330.
[8]MUOZ M,REIMER B,MEHLER B.Exploring New Qualitative Methods to Support a Quantitative Analysis of Glance Behavior[C]// ACM.Proceedings of the 7th International Conference on Automotive User Interfaces and Interactive Vehicular Applications.New York:ACM,2015:125-132.
[9]SNEDDON A,MEARNS K,FLIN R.Stress,fatigue,situation awareness and safety in offshore drilling crews[J].Safety Science,2013,56:80-88.
[10]马勇,付锐.驾驶人视觉特性与行车安全研究进展[J].中国公路学报,2015,28(6):82-94.
[11]BAZZAN A L C,KLÜGL F.A review on agent-based technology for traffic and transportation[J].The Knowledge Engineering Review,2014,29(03):375-403.
[12]EHSANI J P, LI K, SIMONS-MORTON B G, et al. Conscientious personality and young drivers' crash risk[J]. Journal of Safety Research, 2015, 54: 83. e29-87.
[13]TOLEDO T, MUSICANT O, LOTAN T. In-vehicle da-ta recorders for monitoring and feedback on drivers' behavior[J]. Transportation Research Part C: Emerging Technologies, 2008, 16(3): 320-331.
[14]郑玲,乔旭强,倪涛,等.基于多维信息特征分析的驾驶人认知负荷研究[J].中国公路学报:2021,1-14.
[15]GUOFA L,EBEN S,CHENG,et al.Estimation of driving style in naturalistic highway traffic using maneuver transition probabilities[J].Transportation research,Part C.Emerging technologies,2017.
[16]KONDOH T,YAMAMURA T,KITAZAKI S,et al.Identification of Visual Cues and Quantification of Drivers' Perception of Proximity Risk to the Lead Vehicle in Car-Following Situations[J].Jmtl,2008,1(2):170-180.
[17]WANG W,XI J,ZHAO D.Driving Style Analysis Using Primitive Driving Patterns with Bayesian Nonparametric Approaches[J].IEEE Transactions on Intelligent Transportation Systems,2017.
[18]WANG W,ZHAO D,HAN W,et al.A Learning-Based Approach for Lane Departure Warning Systems with a Personalized Driver Model[J].IEEE Transactions on Vehicular Technology,2018,PP:1-1.
[19]周建英,王飞跃,曾大军.分层Dirichlet过程及其应用综述[J].自动化学报,2011(04):389-407.
[20]TEH Y W,JORDAN M I,BEAL M J,Blei D M.Hierarchical Dirichlet processes[J].Journal of the American Statistical Association,2006,101(476):1566-1581
[21]SETHURAMAN J A constructive definition of Dirichlet priors[J].Statist.Sinica,vol.4,pp.639-650,Mar.1994.
[22]JOHNSON M J,WILLSKY A.The Hierarchical Dirichlet Process Hidden Semi-Markov Model[J].Association for Uncertainty in Artificial Intelligence,2012:252-259.
[23]FOX E B.Bayesian Nonparametric Learning of Complex Dynamical Phenomena[D].Cambridge:MIT 2009.
Zhao Weiguang 1 , Gao Zhenhai 1 , Zhang Zhu 2 , Zhu Naixuan 1
1. State Key Laboratory of Automobile Simulation and Control , Jilin University
2. Changhe Automobile Co ., Ltd.
Abstract: As a common driving behavior on highways, lane changing has many effects on traffic flow.How to achieve safe, reasonable, and human-imitative autonomous lane-changing is a current research hotspot in the field of autonomous driving.Based on the driver's lane-changing behavior data, this paper extracts lane-changing characteristic parameters reflecting the driver's behavior, studies the human-imitative lane-changing trigger mechanism, uses polynomial curves to achieve lane-changing trajectory planning, and designs feedforward-feedback tracking controller based on preview theory.The simulation results show that this method can realize human-imitative lane change triggering, trajectory planning and good tracking control.
Key words: lane change, human-imitative trigger mechanism of lane change, trajectory planning, tracking control