杨彬 1 ,宋学伟 1 ,张勇 2 ,高振海 1
1.吉林大学汽车仿真与控制国家重点实验室
2.江西昌河汽车有限责任公司
【摘要】 为保证车辆在障碍物规避过程中满足交通环境、汽车行驶能力、驾乘人员体验感的需求,本文提出一种多目标多约束的轨迹规划方法。本文将贝塞尔曲线拟合器应用于状态格框架,用以生成候选的避障轨迹簇。之后,本文针对轨迹的可通过性和驾驶人行为接近程度设计了多目标轨迹评价函数,对轨迹簇进行了多方面的评价和筛选。为提升本文提出方法的时效性,我们离线地进行了轨迹拟合参数的采样,并利用上述评价函数完成了不同障碍物位置下的避障轨迹的优选。优选轨迹的拟合参数被用以进行BP神经网络的训练。将训练好的神经网络模型应用于轨迹规划器中,实现了不同车速、不同障碍物位置下的避障轨迹的规划。
【关键词】 轨迹规划,贝塞尔曲线,车辆动力学模型,多目标轨迹筛选
Collision Avoidance Trajectory Planning for Autonomous Vehicles Simulating Driver Behavior
Yang Bin 1 , Song Xuewei 1 , Zhang Yong 2 , Gao Zhenhai 1
1. State Key Laboratory of Automotive Simulation and Control , Jilin University
2. Changhe Automobile Co ., Ltd .
Abstract: In order to meet the needs of traffic environment, driving ability and experience of drivers and passengers in the process of obstacle avoidance, this paper proposes a multi-objective and multi constraint trajectory planning method. In this paper, Bessel curve fitting is applied to the state lattice framework to generate candidate obstacle avoidance trajectory clusters. After that, this paper designs a multi-objective trajectory evaluation function for the trafficability of the trajectory and the proximity degree of the driver's behavior, and evaluates and selects the trajectory cluster in many aspects. In order to improve the timeliness of the proposed method, we sample the trajectory fitting parameters offline, and use the above evaluation function to complete the optimization of obstacle avoidance trajecto-ry under different obstacle positions. The optimal trajectory fitting parameters are used to train BP neural network. The trained neural net-work model is applied to the trajectory planner to realize the obstacle avoidance trajectory planning under different speed and different ob-stacle position.
Key words: trajectory planning,bézier curve,multi-objective trajectory screening
轨迹规划是车辆实现无人驾驶的关键环节。无人驾驶车辆在复杂的行驶环境中能够快速生成无碰撞、运动学上可通行的参考轨迹是十分必要的。同时,避碰轨迹应尽量与真实驾驶人操纵下的行驶轨迹相接近,无人驾驶时的车辆运动表现也应尽量靠近真实驾驶人的驾驶行为。地面移动机器人的轨迹规划问题通常采用图搜索法、采样法和插值曲线的方法解决 [1] 。车辆虽然同样为非完整约束系统,但车辆受到更多约束的限制,可移动的自由度远远低于机器人。同时,车辆是一种载人工具,在轨迹规划时不可避免地需要考虑驾驶人的驾驶习惯以及驾乘人员在车内的舒适性。
状态格算法则用状态网格离散表示搜索空间,并在网格之间以车辆可通行的路径进行连接。这样就将轨迹搜索问题转化为允许车辆从一个初始状态格到最终状态格的局部查询问题。状态格算法在自主车辆避障规划中得到了广泛的应用,并在2007年DARPA城市挑战赛中取得了良好的效果 [2] 。状态格之间通常根据车辆相关参数以插值曲线拟合 [3,4] 的方式进行连接。但需要在在拟合过程中结合车辆动力学模型进行拟合参数的约束或轨迹的筛选,才能够保证局部参考轨迹是车辆可完全跟随的。近年来,人们对适应驾驶人行为特征的ADAS系统进行了探索。然而,不同驾驶人对于车辆有不同的理解,控制车辆行进时将会产生不尽相同的驾驶行为。其中,驾驶风格这一动态参数反映了驾驶者在同一驾驶情景下驾驶模式的差异 [5] 。为了实现一种高质量的自动驾驶方式,Bellem等人根据侧向和纵向加速度、急动度等车辆运动状态参数来区分日常、舒适和运动的风格 [6] 。或者通过连续的索引值来评价驾驶风格,索引值的最大值和最小值对应于驾驶风格的极端情况。驾驶风格是由与索引值相对应的有限类别(冷静、正常和激进)来评估的 [7] 。
为保证车辆在障碍物规避过程中满足交通环境、汽车行驶能力、驾乘人员体验感的需求,在相关工作的基础上,本文提出了一种综合考虑车辆运动特性和驾驶行为的实时避障轨迹规划器。根据车载传感器在行驶空间中采集的车辆位置和环境信息,在障碍物的侧向位置衍生出终端状态格,并在自车位置与衍生状态格之间的轨迹通过三阶贝塞尔曲线规划器来拟合。之后,对轨迹拟合参数进行小规模采样,并组成候选的避障轨迹簇。之后,针对轨迹的行驶可达性和驾乘接受性对轨迹簇中的轨迹进行筛选和评价。为提升本文提出方法的时效性,我们离线地完成了障碍物可能位置的采样,并利用上述评价函数完成了不同障碍物位置下的避障轨迹的优选。优选轨迹的拟合参数被用以进行BP神经网络的训练。将训练好的神经网络模型应用于轨迹规划器中,实现了不同车速、不同障碍物位置下的避障轨迹拟合参数的预测,并最终完成了避障轨迹的在线规划。
无人驾驶车辆的避障轨迹规划的问题在于如何生成一条能够使车辆从初始状态到目标状态的稳定、安全的避障轨迹。避障轨迹规划的目标则是使所得结果既考虑车辆的运动特性,保证路径跟踪的可跟随性。又要满足一定的曲率约束和连续性条件,并尽可能接近真实驾驶人的驾驶行为。使车辆在跟踪过程中能保持良好的控制稳定性和驾乘人员接受性。
为精确预测车辆在循迹时的车辆行驶状态参数的变化规律,需要在车辆路径规划算法中引入车辆动力学模型。车辆在地面运动的动力学过程非常复杂。而无人驾驶车辆的规划层中,过于复杂的模型是不必要的。在此只考虑车辆的侧向运动和横摆运动,忽略车辆纵向车速的瞬态变化,且不考虑大幅度急转转向盘的情况。在这样的车辆运动假设下,引入简化的车辆单轨模型 [8] 如图1所示。
图1 车辆单轨模型
本文提出的方法生成的局部参考轨迹通过基于车辆动力学模型的纯跟踪算法进行轨迹跟随控制。从自行车模型出发,纯跟踪算法以车后轴为切点,车辆纵向车身为切线,通过控制前轮转角,使车辆可以沿着一条经过前方参考轨迹上的预瞄点的圆弧行驶,实现轨迹跟随。通过控制前视距离进行循迹跟踪控制器的控制,越大的前视距离表示更远的预瞄点,会使轨迹的跟踪更平滑;越小的前视距离表示更近的预瞄点,会使轨迹的跟踪更精准,但会导致车辆循迹过程出现剧烈摆动。一般来说,前视距离与车辆的车速和参考轨迹的曲率相关,本文通过实车测试对前视距离与车速、参考轨迹曲率进行了非线性标定。
在实际换道过程中对障碍车辆和自车进行矩形包裹。衍生状态格是由障碍物和避障车辆衍生的矩形方格,其尺寸同自车尺寸,其位置和状态参数由障碍物确定。衍生状态格创建完成后,因为自车与衍生状态格位置重合时几乎可保证避障车辆与障碍物间不发生碰撞,故避障轨迹便是在自车和衍生状态格之间规划 [9] 。由于贝塞尔曲线在拟合区间上都可以用多项式来逼近,且一致收敛;同时,贝塞尔拟合可以通过很少的控制点,去生成复杂的平滑曲线,且十分容易进行局部轨迹的调整 [10] 。自车位置和衍生状态格之间通过贝塞尔曲线进行轨迹拟合。
贝塞尔曲线的计算成本随阶数的增加而增加,为提升避障轨迹的计算效率,选用可生成连续曲率轨迹的最小阶数曲线:三阶贝塞尔曲线进行起始点至终点之间的轨迹拟合。由平面上4个控制点 P 0 、 P 1 、 P 2 和 P 3 可唯一确定一条三阶贝塞尔曲线。拟合轨迹的控制点示意图如图2所示。贝塞尔曲线规划器生成的轨迹随控制点 P 1 和 P 2 的移动而变化。受轨迹段起始、终端位置的曲率连续性约束,控制点 P 1 和 P 2 应位于参考轨迹的切线方向。因此,在确定了控制点 P 0 和 P 3 的位置后,通过对贝塞尔曲线控制点参数 e 1 和 e 2 进行合理的赋值,对 P 1 和 P 2 的位置进行调整,即可实现对拟合轨迹的局部调整。
图2 贝塞尔曲线规划器的相关参数示意图
e 1 和 e 2 的值对拟合曲线的曲率变化有很大的影响。 e 1 和 e 2 的值分别影响初始段和终端段的曲率变化。较大的 e 值对应于曲率变化较小的轨迹段,相应部分的曲线段越平滑。通常, e 1 和 e 2 的选择在区间[0.2,0.5]内 [11] ,本文中的轨迹拟合参数也将在此区间内选取和采样。
不同驾驶人在驾驶过程中,由于驾驶习惯和人为因素的不同,会有不同的行为规律。其中,驾驶风格通常能够反映出有相似驾驶行为的驾驶人在行驶过程中的行为规律,也能够反映出不同驾驶人在相同驾驶场景下驾驶行为的差异。为使轨迹规划器在轨迹规划的过程中考虑驾驶人实际驾驶行为,实现拟人化的无人驾驶,本文首先对不同驾驶人在行驶过程中的侧向运动控制信号进行分析,并以此对驾驶人的驾驶风格进行分类。通过拟合轨迹与驾驶风格分类结果的相似度则可以对轨迹的拟驾驶行为进行评价。
ISO 2631标准 [12] 利用加速度均方根值对车内人体舒适性进行了评估。利用总加速度加权均方根值评价可以对局部路段内,车辆行驶过程中车内人员的舒适程度较好地进行评价。侧向加速度变化率,或急动度通常是产生乘坐不舒适感的直接因素。急动度的突变也往往出现在车辆转向,特别是急转向的过程中。在车辆进行转向时,会产生明显的瞬时侧向冲击,容易引起乘坐不适。参考ISO-2631标准,利用急动度均方根值对侧向冲击的接受程度进行评价。而利用侧向急动度峰值表征驾乘人员对侧向冲击的容忍程度。因此,将侧向加速度均方根值、侧向加速度峰值、侧向急动度均方根值、侧向急动度峰值作为驾驶人偏好风格的评价指标,以实现基于车辆运动参数特征的驾驶人风格分类。而驾驶人风格分类数据通过车辆在真实道路上的实际行驶状态获得。
AP算法(Affinity Propagation algorithm)是一种基于特征的数据聚类方法,特别适合高维、多类数据快速聚类 [13] 。基于AP算法的驾驶人风格分类结果如图3所示。AP分类器将21组行驶数据划分为2类驾驶风格。分别将两种驾驶风格命名为稳健型和激进型驾驶风格。如图3所示,由红色线连接的集合具有较大的驾驶风格特征值,表明车辆在避障或过弯时趋向更快地完成转向动作,转向盘转速更快,将这一集合称为激进型风格。反之,由绿色线连接的集合具有较小的驾驶风格特征值,表明车辆的行驶过程更平稳,转向动作更平滑,将这一集合称为稳健型风格。
图3 基于AP算法的驾驶人风格分类结果
驾驶风格的分类结果将作为避障轨迹拟合后拟驾驶行为评价的参考。避障轨迹在完成拟合后,通过车辆动力学模型进行驾驶风格特征参数的估算。将这一特征参数分别与激进风格、稳健风格的聚类中心进行欧式距离的计算,得到拟合轨迹对于两个类别中心的相似度。相似度更高的聚类中心代表的类别即为这一条拟合轨迹的类别。
为保证车辆在障碍物规避过程中满足交通环境、汽车行驶能力、驾乘人员体验感的需求,本文针对行驶可达性和驾乘接受性对轨迹进行筛选和寻优。
受车辆转向半径的约束,需保证拟合的曲线上任意点曲率不小于车辆当前速度下的最小转向半径,在Bézier曲线上的任意点需满足:
另外,为防止车辆在转向过程中发生侧滑或侧倾,提升避障路径的舒适性,需选择适当的参数对侧向加速度、横摆角速度和侧向急动度进行约束。
a ( t )≤ a max
ω ( t )= v y · κ ( t )≤ ω max
j ( t )= a′ ( t )≤ j max
其中,车辆侧向加速度和侧向急动度由车辆动力学模型估算得到,而横摆角速度通过轨迹参数计算获得。
通过车辆动力学模型可实现对拟合曲线进行车辆运动状态参数的估算。将轨迹簇中的每条轨迹的运动控制参数与1.3节中获得的驾驶人风格化分类的聚类中心进行欧式距离的计算,实现轨迹与驾驶人风格化分类结果的匹配。轨迹必然会与其中某一个聚类中心有较高的相似度,因此我们将分别计算与轨迹车辆行驶状态参数集与两个驾驶人风格化聚类中心的相似度,并作为轨迹人性化评价指标。轨迹状态参数与相应的聚类中心越接近,表明轨迹越接近于相应驾驶风格的真实驾驶人的驾驶行为,拟人化程度越高;反之,则表明轨迹虽然是安全可通行的,但与驾驶人的驾驶习惯相差较大,容易使驾乘人员产生不适感。
通过起始避障位置和终端状态点拟合出的轨迹不仅应满足车辆的约束,还应有较小的侧向加速度和侧向急动度以保证车辆在转向过程中保持良好的操纵稳定性和行驶平顺性。基于关于轨迹的行驶可达性和驾乘接受性的分析,设计轨迹综合评价函数如下式所示。
式中, a max 表示路径段的最大侧向加速度; j max 表示最大侧向急动度; ρ d 表示轨迹与驾驶风格的接近程度; w 为权重系数:*表示数据经过标准差归一化的数据结果。成本函数越小则表征避障轨迹更具有期望驾驶风格的特点,且轨迹满足车辆的运动性质,车辆能够更为平稳快速地对路径段进行跟踪。
每种驾驶风格均会对应一个相似的评价函数,区别仅在于评价函数中调用了不同的聚类中心车辆行驶状态参数集合。较低的评价函数值表明轨迹是相对安全、更接近对应驾驶风格的可通行轨迹。我们将选择其中最低的评价函数值对应的轨迹作为选定驾驶风格下的最适宜轨迹。将轨迹的拟合参数记录下来,得到“驾驶风格—车辆运动状态参数—轨迹控制参数”的对应关系,最终实现人性化的轨迹规划。
不同障碍物相对位置下,通过调整轨迹拟合参数可以拟合出无限多条局部避障轨迹。若在线进行上述轨迹生成和筛选,计算负担巨大,难以满足无人驾驶车辆的实时规划需求。因此,快速确定出一条局部最优的可行轨迹是十分必要的。在假定障碍物的位置后,离线进行局部避障轨迹拟合参数的优选和计算。将离线计算的结果作为样本训练神经网络模型。车辆上则利用训练好的神经网络模型对轨迹拟合参数进行快速预测。以这样的方式进行控制点位置的预测,可以快速得到理想局部轨迹,实现避障轨迹的在线快速规划。BP神经网络是一种按误差反向传播算法训练的多层前馈网络,是目前应用最广泛的神经网络之一。通过一个三层网络可以模拟任意复杂的非线性问题。因此,对于障碍物相对位置到轨迹控制参数这一非线性映射问题,本文利用三层BP网络实现轨迹控制参数的预测。
图4 神经网络回归分析图(稳健风格)
图5 神经网络回归分析图(激进风格)
神经网络的隐含层神经元之间采用Sigmoid型传输函数,输出层神经元使用线性传输函数,用共轭梯度法进行神经网路的训练。神经网络输入端为2个输入,分别是障碍物相对于车辆的纵向位置和侧向位置;输出层2个输出分别为 e 1 和 e 2 。针对激进风格和稳健风格驾驶数据分别进行上述神经网络的训练。在约3500个测试样本下,训练后的神经网络对于避障轨迹拟合参数的预测值和真实值分布及线性回归分析如图4和图5所示。激进风格和稳健风格的训练网络下,相应测试集的网络输出值与目标数据均有较小的误差。均方根误差 ,满足神经网络的预测需求。两个网络的预测值与目标值线性回归表现较好,均具有较好的拟合优度。
本节中的结果是在对比仿真试验中获得的 [14] 。本节在公路驾驶和城市驾驶的两种试验场景下,分别以稳健驾驶风格和激进驾驶风格进行避障轨迹的生成。
如图6所示,测试场景1为双车道高速公路场景,测试车辆以80km/h的速度行驶并接近单一障碍物,测试车辆需及时进行障碍物规避动作;测试场景2为双车道城市驾驶场景,测试车辆以30km/h的速度行驶,在测试车辆的当前车道和相邻车道上均有障碍物阻碍车辆的行驶,要求测试车辆能够同时避让多个障碍物。
公路驾驶场景下,测试车辆在双车道线的结构化道路上行驶,并在行驶路段前方放置障碍物用以干扰测试车辆的正常循迹行为。稳健风格和激进风格下的避障表现如图7所示,两种避障风格均能使车辆平稳转向规避障碍物。在测试场景中,稳健风格下,车辆的避障轨迹更加平稳,车辆在循迹过程中具有更小的侧向加速度和急动度变化,对应于更舒适、更平滑的转向过程。
图6 公路驾驶(上图)和城市驾驶(下图)仿真场景
图7 高速测试场景下测试结果对比
与公路驾驶场景类似,城市驾驶场景中,环境更加复杂,突发状况多,测试车辆具有更低的车速,同时路径段上存在更多的障碍物干扰,测试结果如图8所示。激进风格下,测试车辆的避障行为更明显,车辆的转向动作更加迅速,也将会产生更大的侧向加速度和急动度变化。稳健风格下的测试车辆则会表现出更平滑转向动作。测试车辆产生的侧向加速度和急动度均保持在较低的阈值之下。在保证驾乘感受平稳和舒适的前提下实现了风格化的避障行为。
图8 低速测试场景下轨迹对比
为满足不同驾驶风格的避障行为需求,本文提出了终端状态区域进行轨迹规划的方法,并用多目标轨迹筛选的方式优选出一条符合车辆运动特性、具有期望驾驶风格的避障轨迹。驾驶人风格在实际驾驶人驾驶数据的基础上通过AP分类器完成了较为科学的聚类,并通过离线的神经网络训练对轨迹拟合参数进行了准确预测,以满足自动驾驶车辆局部轨迹的在线规划需求。我们在多种仿真工况中进行了测试,试验结果也证明了本文方案的有效性。通过多目标轨迹筛选的方法不仅能够对拟合轨迹进行车辆运动特性的筛选,而且能够根据偏好驾驶风格进行避障轨迹的个性化选择。
[1]GONZÁLEZ D,PÉREZ J,MILANÉS V,et al.A Review of Motion Planning Techniques for Automated Vehicles[J].IEEE Transactions on Intelligent Transportation Systems,2016,17(4):1135-1145.
[2]WERLING M,KAMMEL S,ZIEGLER J,et al.Optimal trajectories for time-critical street scenarios using discretized terminal manifolds[J].International Journal of Robotics Research,2012,31(3):346-359.
[3]RUI O,CIRILLO M,ARTENSSON J M,et al.Combining Lattice-Based Planning and Path Optimization in Autonomous Heavy Duty Vehicle Applications[C]//IEEE Intelligent Vehicles Symposium(IV).IEEE,2018.
[4]CHOI J W,HUHTALA K.Constrained path optimization with Bézier curve primitives[C]//2014 IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS 2014).2014.
[5]MARTINEZ C M,HEUCKE M,WANG F Y,et al.Driving Style Recognition for Intelligent Vehicle Control and Advanced Driver Assistance:A Survey[J].IEEE Transactions on Intelligent Transportation Systems,2018,666-676.
[6]BELLEM H,SCHöNENBERG T,KREMS J F,et al.Objective metrics of comfort:Developing a driving style for highly automated vehicles[J].Transportation Research:Part F.2016.41:45-54.
[7]RATH J J,SENOUTH C,POPIEUL J C.Personalized Lane Keeping Assist Strategy:Adaptation to Driving Style[J].IET Control Theory & Applications.2018.13(1):106-115.
[8]ABE M.Vehicle Handling Dynamics:Theory and Application[M].[sl]:Elsevier Science Technology.2015.47-60.
[9]胡延平,田博,陈无畏,等.基于障碍物衍生状态格的智能车避障轨迹规划[J].汽车工程.2019(8).
[10]YANG K,SUKKARIEH S.An Analytical Continuous-Curvature Path-Smoothing Algorithm[J].IEEE Transactions on Robotics.2010.26(3):561-568.
[11]LONG H,YASHIRO H,NEJAD H,et al.Bézier curve based path planning for autonomous vehicle in urban environment[C]//Intelligent Vehicles Symposium.2010.
[12]International standard.Mechanical vibration and shock -Evaluation of human exposure to whole-body vibration[S].ISO 2631-1:1997(E).1997.
[13]FREY B J,DUECK D.Clustering by Passing Messages Between Data Points[J].Science.2007.315(5814):972-976.
[14]DAVID M,NOSRATINIA M,KESHAVARZ M,et al.On Path Planning Methods for Automotive Collision Avoidance[C]//IEEE Intelligent Vehicles Symposium.2013.