杜盼 1 ,王媛 2 ,吴志成 1 ,赵玉壮 1
1.北京理工大学机械与车辆学院
2.北京汽车集团越野车有限公司
【摘要】 主要介绍了无人车辆进行路面辨识的一种新方法,该方法基于支持向量机算法建立路面辨识模型,利用实车车身俯仰角速度数据训练路面辨识模型,通过对辨识准确度影响因素的探讨,得到最优化的路面辨识模型。利用测试集进行测试,路面辨识模型准确率达到93%以上。
【关键词】 路面辨识,机器学习,车身俯仰角速度
Research on Road Identification Technology of Unmanned Vehicle Based on Body Pitch Angular Velocity
Du Pan 1 , Wang Yuan 2 , Wu Zhicheng 1 , Zhao Yuzhuang 1
1. School of Machinery and Vehicle , Beijing Institute of Technology
2. BAIC off road vehicle Co ., Ltd.
Abstract: This paper mainly introduces a new method of road identification for unmanned vehicles.The road identification model is established based on the support vector machine algorithm,and the road identification model is trained by using the pitch angular velocity data of the real vehicle body.Through the discussion of the factors affecting the identification accuracy,the optimized road identification model is obtained.Using the test set,the accuracy of the road identification model is more than 93%.
Key words: road perception,machine learning,vehicle body pitch angular velocity
近年来,随着计算机科学的兴起,无人驾驶技术得到了迅猛发展。对无人驾驶车辆而言,环境辨识是实现运动控制、导航定位和路径规划等行驶任务的基础,其中路面识别是环境辨识中的重要环节。当车辆在各种路面场景上行驶时,及时获取路面类型可为车辆的安全性、舒适性和燃油消耗优化提供重要信息 [1-3] 。2008年,Christian Weiss [4] ,Hashem Tamimi和Andreas Zell [5] 在包含14种不同地形类别的数据集上测试了两种用于地形分类的方法。第一种方法使用从图像数据中提取的纹理特征,第二种方法使用在机器人体内引起的振动。两种方法都使用SVM进行分类。此外,作者融合了有关相应图像和振动数据的预测。融合使用由SVM估算的地形类别概率,得出融合的预测比单独方法的预测可靠得多的结论。2012年,Christopher A.Brooks和Karl Iagnemma [6] 提出了一个自监督式学习框架,使机器人系统能够基于以前穿越过的相似地形的机械特性测量,学习预测遥远地形的力学特性,通过一个四轮机器人在室外火星模拟环境中的实验数据,证明了自监督式学习框架及其支撑算法的高精度。
本文采用车载惯性测量元件实时监测行驶在碎石路和柏油路上车辆俯仰角速度响应信号,并利用支持向量机算法,对不同类别路面模型的统计学特性进行识别,来辨识两种特定路面模型。
1995年,著名学者V.N.VAPNIK提出了支持向量机的数值理论 [7] ,其是以统计学的VC维理论为依据,在极小的结构风险性原则下,进行的一种机器理论的计算方法。实际过程是利用核函数将低维线性不可分的数据,映射到高维空间求解凸二次规划,得到一个超平面将数据区分开。
给定一个二分类器数据集 ,其中 y n ∈{+1,-1} [8] 。如果两类样本是线性可分的,即存在一个超平面 w T x + b =0,将两类样本分开,那么对于每个样本都有:
数据集 D 中每个样本 x ( n ) 到分割超平面的距离为
定义间隔(Margin)γ为整个数据集 D 中所有样本到分割超平面的最短距离:
如果间隔 γ 越大,其分割超平面对两个数据集的划分越稳定,越不容易受噪声等因素影响。支持向量机的目标是寻找一个超平面( w * , b * )使得 γ 最大,即
令 =1,则公式(4)等价于
数据集中所有满足 y ( n ) ( w T x ( n ) + b )=1的样本点,都称为支持向量。
对于一个线性可分的数据集,其分割超平面有很多个,但是间隔最大的超平面是唯一的。图1给定了支持向量机的最大间隔分割超平面的示例,其中红色样本点为支持向量。
图1 SVM示意图
作为一种模式分类方法,支持向量机的分类结果主要受到核函数参数、惩罚因子以及核函数类型等因素的影响,模型的泛化能力在一定程度上也取决于我们所选择的模型参数。因此,如何选择最优的参数组合使分类结果达到最好,是当前支持向量机研究中的一个重点问题。图2是本实验的支持向量机辨识流程图 [9] 。
图2 SVM辨识流程图
设定数据输出频率为100Hz,选取驾驶位作为惯性导航元件位置,取多组实验数据,得到随机一段60s车身俯仰角速度原始数据如图3所示。
图3 实车姿态角速度原始数据
由图可知,碎石路路面颠簸,车辆行驶在碎石路的车身俯仰角速度值集中在-2°/s~2°/s,而柏油路路面平坦,因而车身俯仰角速度值集中在-0.5°/s~0.5°/s。总体而言,行经柏油路面的车身俯仰角速度较行经碎石路路面的车身俯仰角速度波动小,但是由图易知,柏油路数据约39s、58s时有较为剧烈的变化,另一方面,碎石路面也不乏数据平稳的数据段。因此,如何选择合适的数据预处理方法对于路面辨识模型的训练及辨识准确度有着至关重要的影响。
随机选取两种路面连续的6000个车身俯仰角速度数据点,如图3所示。将两种路面各分成60个样本组,每个样本组100个数据点。为了排除相邻样本组间的关联性对路面辨识模型的训练产生不可预测的影响,本实验将两种路面按先碎石路后柏油路的次序首尾拼接得到120x1的样本组矩阵,经过统计特征处理后,得到后续的数据组。在matlab中引用randperm函数将数据组随机打乱,然后再作为路面辨识模型训练过程的输入,以使路面辨识模型拥有更加科学的训练数据。
由原始数据可知,车辆在行驶过程中俯仰角速度是一个带方向的矢量,而俯仰角速度的方向在路面辨识的过程中可以被忽略,因此采用选取数据的标准差或均方根值等统计特征值 [10] 的方法来进行数据的预处理,各统计特征值的计算公式见表1。
将上述数据的统计特征值处理进行绘图比较,如图4所示。其中前60组为碎石路样本组,后60组为柏油路样本组,见图中注。
由上述曲线的平滑度和幅值变化,本实验采用先取前4s数据的统计特征值作为一个数据组,然后每隔1s使用前3s的统计特征值作为下一个数据组的办法对样本组进行迭代处理。如1、2、3、4s的统计特征值为第一个数据组,2、3、4、5s的统计特征值为第二个数据组,如此循环,见表2。
表1 时域上的统计特征
图4 样本组数据预处理图
表2 数据预处理过程示意表
经过处理后的数据重复度为66%。这样处理的好处是可以保证辨别的时效性,避免生成数据的时延性而导致模型识别缓慢,同时数据连续可以提高辨识的相关性,有效地降低了训练集的误差。
经过该方法迭代计算后,原本前60个碎石路样本组被分为57个数据组,同理,后60个柏油路样本组被分为57个数据组,由前述首位拼接过程,得到114个数据组,在matlab中引用randperm函数将数据组随机打乱,作为路面辨识模型训练过程的输入。此外,将前57个数据组即碎石路数据组表示为标签1,后57个柏油路数据组表示为标签2,通过对比测试集的路面标签与辨识集的路面标签来判别路面辨识模型的准确度。
将上述114个数据组随机打乱后,选取29个数据组作为训练集,85个数据组作为测试集,以此作为参照组,以便后续模型优化。
将数据集导入编写好的程序中,进行多次迭代训练,对初步模型的辨识结果进行误差分析,不断调整参数以优化模型,直至误差减小到允许范围内。
训练完成后,将剩余数据组作为路面辨识模型的测试集,通过对比测试集的路面标签与路面辨识模型的辨识集标签来判别模型的路面辨识是否正确,如标签一致说明辨识正确,如标签不一致则说明辨识不正确,由此即可得到该辨识模型的准确度。将测试集标签与辨识集标签导出,进行可视化处理,可视化的辨识结果如图5、图6所示。
图5 辨识样例图1(均方根法)
图6 辨识样例图2(标准差法)
圆环内环为标签1,即碎石路,外环为标签2,即柏油路,圆环顺时针方向表示由0到86组数据组。当辨识正确时,辨识集标签等于测试集标签,则代表辨识集的橘色点覆盖代表测试集的蓝色;当辨识不准确时,橘色蓝色均显示在圆环刻度表上,由蓝色点位置即可推测出辨识错误的对应组数。在辨识样例1中,辨识模型在第17、42、49、60、69组中均将碎石路辨识成柏油路,而在辨识样例2中,辨识模型在第9、59、82组中将碎石路辨识成柏油路,在第52组中将柏油路辨识成碎石路。
由上述分析可知,内环蓝点数据多于外环蓝点数据,说明测试集中标签为1的碎石路路面有更高的概率被判定为标签为2的柏油路路面,即经常出现将碎石路面识别为柏油路面的情况,这可能与柏油路面的不平整度或碎石路平整路段有关。
综上所述,采用基于支持向量机分类法对车身俯仰角速度数据的识别与辨识,可以有效区分碎石路面与柏油路面。
数据的预处理决定了模型对于数据识别的灵敏度,进而决定了路面辨识过程的准确度,将均方根预处理方法作为参照组,研究数据预处理对路面辨识准确度的影响。
表3 数据预处理对准确度的影响
由表3可知,辨识准确度最高的数据预处理方法为对数据进行迭代标准差处理的方法,参考样例如图5所示,其次是均方根处理法,参考样例如图6所示。峭度和歪度的辨识准确度一般且稳定性较差。因此本实验选择迭代标准差方法实现数据预处理。此外,实验结果显示,在利用峭度的数据预处理方法在识别柏油路时的准确率最高,均方根识别碎石路时的准确率最高。
测试集组数的多少决定了训练后模型的完整度,理论上说,测试集越多,辨识准确度越稳定,将29组数据组作为参照组,研究测试集组数对路面辨识准确度的影响。
表4 测试集组数对准确度的影响
由表4可知,因为辨识结果具有随机性,而随机改变测试集组数对路面辨识结果准确度在可接受范围内,因此认为测试集组数对路面辨识准确度影响不大。
核函数的形式和参数的变化会隐式地改变从输入空间到特征空间的映射,进而对特征空间的性质产生影响,最终改变各种核函数方法的性能。常用的 -t 核函数有:线性核函数、多项式核函数、径向基核函数、Sigmoid核函数,将径向基核函数作为参照组,研究核函数对路面辨识准确度的影响。
表5 核函数对准确度的影响
由表5可知,选取不同核函数会对路面辨识模型产生较大影响,其中,径向基核函数的辨识准确度最好,线性核函数次之,多项式核函数不能得出有效辨识结果,Sigmoid核函数辨识准确度一般且结果存在巨大不稳定性,因此本实验中选取径向核函数是正确可行的。
本文采用基于车身姿态的无人车路面辨识技术,通过选取实车车身俯仰角速度的迭代标准差值,训练基于支持向量机分类法的路面辨识模型,实现了碎石路和柏油路的准确辨识。通过对照实验法完善路面辨识模型,该辨识模型达到了93%及以上的准确度,这为无人驾驶车辆路面辨识提供了可靠的路面信息。
本文得到的路面辨识模型具有广大的应用空间,除了利用车身俯仰角速度识别路面,还可以实现结合垂直振动加速度等物理量进行多传感器融合的路面识别,这将使路面辨识准确度大大提升。因此,本文所实现的基于单一物理量的路面识别仍然存在一定的不足,无法排除如公路不平整带、减速带、激烈驾驶等带来的数据异变的影响。
[1]陈慧岩,熊光明,赛建伟,等.无人驾驶汽车概论[M].北京:北京理工大学出版社.2014.
[2]袭建伟,姜岩,徐或.无人驾驶车辆模型预测控制[M].北京:北京理工大学出版社.2014.
[3]王世峰,赵馨,孟颖,等.基于人工智能的无人驾驶车辆路面识别技术[M].北京:机械工业出版社.2018.
[4]CHRISTIAN W,HASHEM T,ANDREAS Z.A Combination of Vision -and Vibration-based Terrain Classification[J].2008 IEEE/RSJ International Conference on Intelligent Robots and SystemsAcropolis Convention Center.Nice,France,Sept,22-26,2008
[5]CHRISTIAN W,HOLGER F,ANDREAS Z.Vibration-based Terrain Classification Using Support Vector Machines[C]//Proceedings of the 2006 IEEE/RSJ.International Conference on Intelligent Robots and Systems Oc tober 9-15,2006,Beijing,China.
[6]CHRISTOPHER A B,KARL I.Self-supervised terrain classification for planetary surface exploration rovers[J].Journal of Field Robotics,2012,29(3).
[7]UNNSON C,et al.Autoncwxxis driving in urban environments:Boss and the urban chaDenge[J].Journal of Fidd Robotics,2008,25(8).
[8]邱锡鹏.神经网络与深度学习[Z].2021.
[9]SHI W L,LI Z R,LV W J,et al.Laplacian Support Vector Machine for Vibration-Based Robotic Terrain Classification[J].2020,9(3)
[10]饶雷,唐向红,陆见光.基于CNN-SVM和特征融合的齿轮箱故障诊断[J].组合机床与自动化加工技术,2020(08):130-133+142.