智能网联汽车人机交互理论与技术最新章节_郭钢著

2.4 智能网联汽车多模态人机交互测试评价

2.4.1 测试评价目的、对象和范围

1）测试评价目的

智能网联汽车人机交互涉及座舱空间、布局、显示、操纵、灯光、声音、温度、振动等交互界面，交互主体有座舱内界面、驾驶人和道路场景，在这三者间的交互作用下，按照人的驾驶意图、路径选择、道路场景识别、分析判断决策，人来操控车辆速度和行驶状态控制。测试评价目的是：对智能座舱交互绩效、负荷、满意度和风险进行主、客观结合的测试评价。

站在汽车驾乘人员用户体验的角度，本测试评价规程可真实、客观评价和反映智能网联汽车人机交互系统的绩效、负荷、愉悦度和风险，为智能网联汽车人机交互系统需求挖掘、创新设计、生产制造、销售与售后服务提供科学依据。

2）测试评价对象

智能网联汽车人机交互系统测试评价对象为L1 ～ L5 级智能网联汽车驾乘人机交互系统，包括三部分：智能网联汽车座舱空间与结构布局、智能网联汽车驾乘体验和汽车驾驶控制与信息交互系统。其中，汽车驾驶控制与信息交互系统包括汽车驾驶控制权切换、高级驾驶辅助系统（ADAS）、车载信息系统。

3）测试评价范围

本测试评价规程适用于L1 ～ L5 级别智能网联汽车驾乘人机交互系统需求挖掘、产品定义、方案设计、产品原型、商品车、售后服务等产品生命周期不同阶段的用户体验测试评价，为智能网联汽车人机交互系统设计开发、试验验证、使用维护等提供依据和指南。针对人机交互三个部分对象的驾乘交互体验测试评价范围如下：

①智能座舱空间与结构布局测试评价范围。包括驾乘人员乘坐空间大小与仪表板、中控板、中控台、前后排座椅、车门、车窗、天窗等结构布局及舱内造型、色彩、材质、氛围灯、气味、粉尘、音响、空调等的驾乘交互体验测试评价。

②智能网联汽车驾乘体验测试评价范围。包括驾驶人对汽车行驶方向、匀速、制动、加减速、过弯道操纵稳定性、动力性、平顺性、振动噪声、温度、湿度等的用户体验测试评价以及乘员乘坐汽车的舒适性、安全性、ADAS辅助等的满意度、接受度。

③驾驶控制、驾驶辅助与车载信息系统人机交互测试评价范围。包括驾驶控制权人机间切换、ADAS驾驶辅助交互、车载屏信息系统交互三个方面的绩效、负荷、愉悦、风险四维度主—客观测试评价。

2.4.2 智能网联汽车人机交互测试评价指标体系

1）智能座舱空间与结构布局测试评价指标体系

（1）测试评价指标体系

汽车智能座舱空间与结构布局人机交互测试评价指标体系见表 2.8。

表 2.8 汽车智能座舱空间与结构布局人机交互测试评价指标体系

续表

（2）测试评价指标定义

①空间指标。空间指标分为驾驶空间、乘员空间和可达空间，通过座舱内的空间结构尺寸进行度量。

驾驶空间指驾驶员的坐姿空间和操控空间，坐姿空间包括座椅前后、座椅上下／仰俯角、靠背倾角等调节范围；操控空间包括驾驶员手及手臂、脚及腿的最大与舒适操作范围。驾驶空间要符合中国人体测量标准中的第 5 ～ 95 百分位人体数据和汽车人机工程设计标准要求，测试采用测量距离工具，如激光测距仪、卷尺等，测试数据单位为长—宽—高尺寸（ mm），同时，采用五级主观评价量表评价驾驶员主观感受。

乘员空间指乘员的坐姿空间和操控空间，坐姿空间包括座椅前后、座椅上下／仰俯角、靠背倾角等调节范围；操控空间包括乘员手及手臂、脚及腿的最大与舒适操作范围。乘员空间要符合中国人体测量标准中的第 5 ～ 95 百分位人体数据和汽车人机工程设计标准要求，测试采用测量距离工具，如激光测距仪、卷尺等，测试数据单位为长—宽—高尺寸（mm），同时，采用五级主观评价量表进行乘员主观感受评价。

可达空间指驾乘人员在座舱内手脚及肢体为了完成某项操作交互任务而能正常到达的空间尺寸，须满足中国人体测量标准中的第 5 ～ 95 百分位数据要求，因此，可达空间是一个范围值，座舱内各种交互界面的布置应在这个范围内，其测试方法分为距离测试工具测试（长—宽—高尺寸，mm）和五级主观量表评价。

②布局指标。布局分为座椅布局、操控布局、辅装布局和其他布局。

座椅布局指驾驶员和乘员座椅在座舱内的位置分布，应符合中国人体测量第 5 ～95 百分位数据和汽车人机工程设计标准，主要测试评价驾驶员与乘员进出座椅的安全性、效率及方便性。安全性体现在驾驶员和乘员进出座椅时是否易产生碰头、碰肢体等危险行为；效率体现在驾驶员和乘员进出座椅的时间，单位为秒，时间越长效率越低；方便性指驾驶员和乘员进出座椅是否方便，是否需要侧身或弯腰等。座椅布局指标测试评价采用激光测距仪、卷尺、角尺、计时器、视频行为分析、眼动仪和五级主观评价量表。

操控布局指驾驶员操作方向盘、变速杆、加速踏板、制动踏板、转向灯、大灯、鸣笛灯操控装置的布局，应符合中国人体测量第 5 ～ 95 百分位数据和汽车人机工程设计标准，驾驶员在行驶状态时能感知到操控装置布局的合理性、可靠性、效率和方便性。从主—客观两方面进行联合测试评价，采用激光测距仪、卷尺、角尺、计时器（单位操作响应时长，秒）、行为分析（视频图像）、眼动仪、手指运动轨迹追踪系统、五级主观量表评价等。

辅助布局指驾驶员在操作雨刮、空调、除雾、车窗、音响、导航、蓝牙电话以及观察仪表屏、中控屏上的驾驶辅助信息时感知的辅助装置布局，其合理性、可靠性、效率和方便性应符合中国人体测量第 5 ～ 95 百分位数据和汽车人机工程设计标准。从主—客观两方面进行联合测试评价，采用激光测距仪、卷尺、角尺、计时器（单位操作响应时长，秒）、行为分析（视频图像）、眼动仪、手指运动轨迹追踪系统、五级主观量表评价等。

其他布局包括储物装置和应急装置的布局，应符合中国人体测量第 5 ～ 95 百分位数据和汽车人机工程设计标准，应急装置应布置在便于识别、操控的位置、储物装置布局在便于拿取、存放的位置。从主—客观两方面进行联合测试评价，采用激光测距仪、卷尺、角尺、计时器（单位操作响应时长，秒）、行为分析（视频图像）、眼动仪、手指运动轨迹追踪系统、五级主观量表评价等。

③造型指标。汽车智能座舱造型主要表现在几何形态、色彩搭配、材质质感、工艺品质、标识装饰等非结构化感知、认知特征上，很难用物理参数或指标进行评价，因此，在人机交互测试评价中，主要采用用户（驾乘人员）体验的主—客观联合方法，即脑电、眼动、表情与五级主观量表联合测试方法，在体验座舱造型时测试被试目标用户（驾乘人员）的脑电、眼动、表情表征客观数据，然后与五级主观量表评价数据作相关性分析，若主—客观评价数据相关性高，则说明被试对座舱造型评价好或不好，反之，则评价数据不可用。

A.脑电评价。采用非侵入式脑电采集技术，用户与产品交互时的脑电数据能够被脑电仪实时采集。通过脑电数据的分析与特征提取，基于不同的人机交互产品测试任务，能够综合体现用户人机交互过程中的认知负荷、满意度、愉悦度等。其中，脑电波θ频段与α频段的功率谱值变化能够实现用户认知负荷评价，随着测试任务产生的认知负荷升高，额叶θ频段功率谱值增大，顶叶α频段功率谱值减小；大脑前额叶区域的脑电波α频段功率谱的左右半球差异值（ln（α _右）－ln（α _左））能够实现满意度和愉悦度评价，该差异值越大，用户对测试产品的正向评价越高。

B.眼动评价。眼动数据处理分为热点图、扫视顺序图。眼动热点图主要用来反映被试浏览和注视的情况，热点图可展示出被试在刺激材料上的注意力分布情况。红色代表浏览和注视最集中的区域，黄色和绿色代表目光注视较少的区域。这些数据可用于评价车载信息任务、有条件无人驾驶任务。将多名被试热点图进行叠加，可得出主要关注区域。

眼动扫视顺序图主要用来反映被试浏览顺序和注视的情况，可展示出被试在刺激材料上的注意力分布情况和观看先后顺序。圆圈里上面的数据代表被试浏览的顺序，下面的数据代表注视集中的时长，圆圈越大代表目光注视越多、停留时间越长。

C.表情评价。面部表情系统将情绪划分为 7 类：中性、快乐、悲伤、生气、惊讶、害怕、厌恶。 FaceReader ^TM 还支持面部表情分析过程可视化，无论是在实时分析的过程中还是在完成分析后，系统都会生成可视化的情绪强度柱状图、情绪的环形模型饼状图以及连续的情绪分析曲线结果图。此数据可用于评价辅助驾驶任务及有条件无人驾驶任务的用户满意度。

D.量表评价。量表评价分为五级，根据评价指标对各方面进行主观评价测试。被试通过填写问卷的方式对满意度和情绪评价体验感受，量表作为主观评价数据，可与客观数据相互验证，以此检验测试的准确性。主观数据的结果也可作为用户需求分级的依据，根据紧急程度进行选择需求改进的顺序。

E.相关性分析。选用Pearson相关系数，选择SPSS中相关性分析。将需要分析的两组或多组数据导入，进行分析。用字母 r 表示，其阈值为［－1，1］。相关系数 r 越接近－1 或 1，两个变量之间的负相关性或正相关性越强；相关系数 r 越接近 0，两个变量越不相关；当相关系数 r ＝ 0 时，表明两个变量完全不相关。具体可分为如下5 个区间：当| r | ∈［0，0.2］时，两变量呈极弱相关或无相关；当| r | ∈（0.2，0.4］时，两变量呈弱相关；当| r | ∈（0.4，0.6］时，两变量呈中度相关；当| r | ∈（0.6，0.8］时，两变量呈强相关；当| r | ∈（0.8，1］时，两变量呈极强相关。根据人机交互任务，分别选择相符的主客观指标进行相关性分析。

④环境指标。环境指标分为车内氛围照明、气味粉尘、隔音音响和温度湿度，通过座舱内的环境客观指标与主观量表进行度量。

氛围照明指座舱内的可变颜色氛围灯照明，主要表现为照明色彩、亮度等以及考虑人的体验感受，主要采用用户（驾乘人员）体验的主—客观联合方法，即采用色度计、照度计对氛围灯进行测量并采用脑电、眼动、表情与五级主观量表联合测试，在体验座舱氛围照明时测试被试目标用户（驾乘人员）的脑电、眼动、表情表征客观数据，然后与五级主观量表评价数据作相关性分析，若主—客观评价数据相关性高，则说明被试对座舱氛围照明评价好或不好，反之，则评价数据不可用。

气味粉尘指人处在座舱内感受到的气味与座舱对粉尘过滤的程度，主要表现在气味、粉尘含量等以及考虑人的体验感受。评价从主—客观两方面进行联合测试，采用气味体验测试仪、脑电与五级主观量表联合测试方法。

隔音音响指座舱隔绝外部噪声的能力及内部车载音响播放声音的效果，座舱应能隔绝部分外界噪声和振动，但保证能听到外部喇叭的声音；人处在座舱内使用内部车载音响时应感到舒适，声音清晰无杂音且响度范围适中。评价从主—客观两方面进行联合测试，采用脑电仪、声级计与五级主观量表联合测试方法。

温度湿度指座舱内的温度湿度可调，且可调至人体感觉舒适的范围，使人的生理感受和心理感受达到最佳，符合人因工程学。评价从主—客观两方面进行联合测试，采用脑电仪、温度、湿度分析仪与五级主观量表联合测试方法。

⑤愉悦指标。愉悦指标主要表现在总体满意度、空间满意度、布局满意度、造型满意度、环境满意度等人的主观感受。人机交互测试评价主要采用用户（驾乘人员）体验的主—客观联合方法，愉悦指标作为主观数据对座舱的总体、空间、结构、布局、造型、环境等各方面进行五级评价，五级主观量表评价数据与汽车智能座舱目标用户（驾乘人员）的脑电、眼动、表情表征客观数据作相关性分析。若主—客观评价数据相关性高，则可反映被试对座舱造型评价好或不好；反之，则评价数据不可用。

2）智能网联汽车驾乘体验测试评价指标体系

（1）测试评价指标体系

智能网联汽车驾乘体验人机交互测试评价指标体系见表 2.9。

表 2.9 智能网联汽车驾乘体验人机交互测试评价指标体系

续表

（2）测试评价指标定义

①驾驶操控。驾驶操控分为方向操控、速度操控和制动操控。机械（制动踏板、加速踏板、方向盘等）须符合人体形态、尺寸及操作能力和安全可靠，使人在使用过程中用力适当、感觉舒适、操作方便。评价由车辆数据和主观量表度量。

方向操控指车在行驶过程中驾驶员操纵方向盘以控制车辆方向的操作便捷性和操作效率。采集车辆数据，如横向加速度、方向盘转动角度等和肌电数据测量生理负荷，同时，采用五级主观评价量表评价驾驶员主观感受。

速度操控指车在行驶过程中驾驶员操纵加速踏板和制动踏板以控制车辆速度的操作便捷性和操作效率。采集车辆数据，如纵向加速度、车辆行驶速度等，同时，采用五级主观评价量表评价驾驶员主观感受。

制动操控指车在行驶过程中，驾驶员操纵制动踏板以进行制动操作的便捷性和操作效率。采集车辆数据，如反应时间、制动时间、制动距离等，同时，采用五级主观评价量表评价驾驶员主观感受。

②辅驾操控。辅驾操控分为照明操控、雨刮操控、转向灯操控、空调操控、车窗操控和除雾操控。须符合人体形态、尺寸及操作能力和安全可靠，使人在使用过程中用力适当、感觉舒适、操作方便。对交互操作时间和主观量表进行度量。

③振动噪声。振动噪声分为隔振舒适和降噪舒适。主要对用户在振动、噪声等方面的体验、感受（是否舒适）做评价。

隔振舒适是在行驶过程中振动和冲击环境对乘员舒适性的影响。汽车座舱的隔振效果应满足用户对于舒适性的乘坐需求，振动影响应在一定界限之内。由面部表情系统和五级主观评价量表进行驾驶员主观感受评价。

降噪舒适是在行驶过程中外部噪声对乘员舒适性的影响，以及车辆是否具有良好的降噪功能。汽车座舱的降噪效果应满足用户对于舒适性的乘坐需求，其座舱应具有良好的降噪功能，但又不影响外部警示声音（如喇叭）。由声级计进行内外声音响度对比和五级主观评价量表进行驾驶员主观感受评价。

④自动驾驶。自动驾驶汽车的驾乘体验主要表现在安全性、信任度、舒适度和接受度四方面，属于人的感受指标，很难用物理参数或指标进行评价。因此，测试评价主要采用用户（驾乘人员）体验的主—客观联合方法，即脑电、眼动、表情与五级主观量表联合测试方法，在体验驾乘感受时测试目标用户（驾乘人员）的脑电、眼动、表情表征客观数据，然后与五级主观量表评价数据作相关性分析，若主—客观评价数据相关性高，则说明被试对自动驾驶体验评价好或不好，反之，则评价数据不可用。

⑤驾驶辅助。驾驶辅助分为自动紧急制动、车道保持、自适应巡航、自动泊车、倒车影像、环视报警、自动启停和标识识别。人在驾驶过程中启用驾驶辅助系统，通过驾驶辅助系统与人的交互是否有效和用户的体验采用主客观相结合的方式进行评价。

自动紧急制动指预计发生事故时汽车自动紧急制动停车。测试需采集生理数据（如呼吸、心电）和面部表情判断驾乘人员在触发该功能时是否产生惊吓、厌恶等负面情绪，同时，采用五级主观评价量表评价驾驶员主观感受。

车道保持指行驶时车辆借助一个摄像头识别行驶车道的标识线且将车辆保持在车道上并对此提供支持，在车道偏离时提供警示或辅助。测试需采集生理数据（如呼吸、心电）和面部表情判断驾乘人员在触发该功能时是否产生惊吓等负面情绪，同时，采用五级主观评价量表评价驾驶员主观感受。

自适应巡航指系统代替驾驶员控制车速并与前方车辆保持安全距离行驶。测试需采集生理数据（如呼吸、心电）和面部表情判断驾乘人员在触发该功能时是否产生惊吓等负面情绪，同时，采用五级主观评价量表评价驾驶员主观感受。

自动泊车指汽车泊车入位不需要人工控制。测试须计算泊车时间和准确率来评价该功能的效率，并采集生理数据（如呼吸、心电）和眼动判断驾乘人员对该功能的信任度和关注点，同时，采用五级主观评价量表评价驾驶员主观感受。

倒车影像指驾驶员实时在车内监控车外两侧及车后视频画面。测试须采集眼动判断在使用该功能时驾乘人员的关注点，同时，采用五级主观评价量表评价驾驶员主观感受。

环视报警指驾驶员可 360°环视车辆四周并显示并在车辆周围有障碍物、行人等时报警提示，最终实现 360°全方位预警保护。测试须采集生理数据（如呼吸、心电）判断驾乘人员对该功能的信任度，同时，采用五级主观评价量表评价驾驶员主观感受。

自动启停指车辆在临时停车的时候自动熄火并在需要继续前进的时候自动重启发动机。测试须采集生理数据（如呼吸、心电）和面部表情判断驾乘人员在触发该功能时是否产生厌恶等负面情绪，同时，采用五级主观评价量表评价驾驶员主观感受。

标识识别指自动识别交通标志。测试须记录标志识别的准确率，同时，采用五级主观评价量表评价驾驶员主观感受。

⑥体验愉悦。汽车驾乘体验愉悦指标主要表现在总体满意度、驾驶满意度、自动驾驶满意度、驾驶辅助满意度、振动噪声满意度等方面。总体满意度从安全性、信任性、舒适性、接受性 4 个维度评价。驾乘体验测试评价主要采用用户（驾乘人员）体验的主—客观联合方法，愉悦指标作为主观数据对驾驶操控、辅驾操控、振动噪声、自动驾驶、驾驶辅助等各方面进行五级评价，五级主观量表评价数据与驾驶体验过程中目标用户（驾乘人员）的脑电、眼动、表情表征客观数据作相关性分析。若主—客观评价数据相关性高，则说明被试对座舱体验愉悦评价好或不好；反之，则评价数据不可用。

3）汽车驾驶控制、驾驶辅助与车载信息系统测试评价指标体系

（1）测试评价指标体系

智能网联汽车驾驶控制、驾驶辅助与车载信息系统人机交互测试评价指标体系见表 2.10。

表 2.10 汽车驾驶控制、驾驶辅助与车载信息系统人机交互测试评价指标体系

续表

（2）测试评价指标定义

①绩效指标。绩效分为效率、准确性、协调性以及易用性。

效率体现为单位时间内完成的任务数，任务数越大，效率越高，反之越差。效率主要由单位时间操作步骤数和单位时间操作响应时长进行客观评价。各项评价度量的定义如下：

单位时间操作步骤数：在进行制定交互任务过程中，单位时间内完成的操作步骤数。

单位时间操作响应时长：在进行制定交互任务过程中，单位时间内操作到给出反馈的时长。

准确性体现为智能网联汽车人机交互系统表达元素是否清晰及硬件配备是否合理，主要由出错操作步骤数、完成步骤数以及试探步骤数等量纲进行客观评价。

协调性体现为用户使用智能网联汽车人机交互系统时眼手配合的难易程度，主要由眼手配合时长和眼手配合次数进行客观评价。

易用性体现了智能网联汽车人机交互系统是否容易使用及学习成本如何。指标由易用性量表进行五级主观评价。

②负荷指标。负荷体现为人在完成目标过程中需要付出的体力和精神力，可分为操作负荷和认知负荷。

操作负荷体现了在使用智能网联汽车人机交互系统时用户的身体负荷。主要由单位时间内EMG平均幅值、单位时间内EMG标准偏差、单位时间内动作数、任务完成时间、手指移动范围以及手指移动总距离进行客观评价。各项评价度量的定义如下：

单位时间内EMG平均幅值：完成指定交互任务过程中，单位时间内肌电EMG的平均幅值。

单位时间内EMG标准偏差：完成指定交互任务过程中，单位时间内肌电EMG的标准偏差。

单位时间内动作数：完成指定交互任务过程中，单位时间内的操作动作数。

任务完成时间：完成指定交互任务需要的时间。

手指移动范围：完成指定交互任务过程中，手指移动的范围。

手指移动总距离：完成指定交互任务过程中，手指移动的总距离。

认知负荷体现了用户理解智能网联汽车人机交互系统的难易程度，主要由心率HR、注视采样频率及单位时间脑电θ波平均幅值进行客观评价。各项评价度量的定义如下：

心率HR：单位时间内心跳次数，一般为 1 min内的心跳次数。

注视采样频率：完成指定交互任务过程中，对交互界面的注视次数与注视时间的比值。

单位时间脑电θ波平均幅值：完成指定交互任务过程中，用户脑电θ波（4～8 Hz）的平均幅值。

③愉悦指标。愉悦主要包括总体满意度、形态满意度、功能满意度以及交互满意度。其指标由SUS满意度量表、形态满意度量表、功能满意度量表、交互满意度量表和Panas情绪量表等进行主观评价。

SUS满意度量表：作为目前使用较为广泛的HMI产品可用性测试评估问卷，主要调查被试的满意度。

形态满意度量表：用来主观评价用户对智能网联汽车人机交互系统HMI产品的形态满意度。

功能满意度量表：用来主观评价用户对智能网联汽车人机交互系统HMI产品的功能满意度。

交互满意度量表：用来主观评价用户对智能网联汽车人机交互系统HMI产品的交互满意度。

Panas情绪量表具有良好的区分度，是情绪和幸福感有效和可靠的测量工具。Panas情绪量表包含积极及消极情绪描述词各 10 个，分为五级。

④风险指标。主要由车辆行驶状态偏离正常状态而引发的驾驶风险进行描述。驾驶风险体现了用户在驾驶过程中使用汽车人机交互系统所带来的驾驶风险，主要由横向加速度、纵向加速度、驾驶视野偏移率、TTC、TLC以及车道偏离距离等量纲进行客观评价。各项评价度量的定义如下：

横向加速度：与车辆行驶方向垂直的方向的加速度。

纵向加速度：沿车轴向方向的加速度。

驾驶视野偏移率：驾驶员驾驶过程中视线离开驾驶主视野的时间与驾驶总时长的比值及驾驶员驾驶过程中视线离开驾驶主视野的角度。

TTC：自车与前车维持车速不变的情况下，相撞所需的时间。

TLC：驾驶员从当前时刻位置到越过车道线所需的时间。

车道偏离距离：车辆中心与车道中心之间的距离。

2.4.3 智能网联汽车人机交互测试场景与测试设备

1）测试场景

测试场景可分为实车测试场景和模拟驾驶测试场景。

①封闭道路实车测试场景。在试车场的封闭道路上进行的实车人机交互测试道路场景，如图 2.12 所示。

图 2.12 封闭道路实车测试场景

②开放道路实车测试场景。在开放的城市和高速公路上进行的实车人机交互测试道路环境，如图 2.13 所示。

图 2.13 开放城市道路实车测试场景

③模拟驾驶测试场景。可分为六到九自由度带动力学模型模拟驾驶人机交互测试场景（图 2.14）和不带动力学模型的模拟驾驶人机交互测试场景（图 2.15）。

图 2.14 六自由度带动力学模型和光照环境的模拟驾驶测试场景

图 2.15 不带动力学模型的模拟驾驶人机交互测试场景

2）典型测试道路场景

确定测试场景后，根据测试任务和测试目的，确定测试道路场景。测试道路场景可分为实际道路场景和模拟道路场景。两类道路场景分别有城市道路场景和高速公路场景。而场景包括气候、光照、人流量、车流量、建筑物类型等因素。

典型测试道路场景见表 2.11。

表 2.11 典型测试道路场景

3）测试设备

智能网联汽车人机交互系统测试评价所采用的测试设备名称、功能参数、用途等，见表 2.12。

表 2.12 智能网联汽车人机交互系统测试评价设备名称及参数表

续表

2.4.4 测试范式

测试任务的标准化操作内容，主要可分为驾驶主任务、驾驶次任务和驾驶接管任务。

1）驾驶主任务

驾驶主任务指车辆驾驶任务，包括车辆行驶速度、转向、启动、制动、车道保持、避障、变道、超车、靠边停车等。车辆行驶状态和驾驶人操控性、安全性、舒适性评价数据作为评价驾乘体验的依据。驾驶主任务测试涉及的道路场景，见表 2.13。

表 2.13 智能网联汽车驾驶主任务

2）驾驶次任务

驾驶次任务指除驾驶主任务以外的其他驾驶任务，包括信息交互任务和驾驶辅助任务。

（1）信息交互任务（听音乐、听广播、拨打电话、开关空调、使用雨刮等）

信息交互任务的定义：在信息交互系统（如中控屏、仪表屏、抬头显示）上，对音乐、导航、广播、电话、空调、座椅通风／加热、氛围灯等功能进行信息交互的任务，见表 2.14。

表 2.14 信息交互任务

续表

（2）驾驶辅助任务（ADAS）

高级驾驶辅助任务包括自适应巡航ACC、车道保持系统LKS、车道偏移预警LDW、前碰撞预警与AEB紧急制动、自动泊车系统AP等组成。驾驶辅助任务，见表2.15。

表 2.15 驾驶辅助任务

3）驾驶接管任务

L3～ L4 智能网联汽车驾驶控制权接管任务主要包括车接管人、人接管车两类任务。驾驶接管任务，见表 2.16。

表 2.16 驾驶接管任务

续表

2.4.5 人机交互测试评价方法

1）测试范式选择

根据测试的对象和目的，选择相应的测试范式，具体测试范式见 2.4.4 节。测试范式选择表见表 2.17。

表 2.17 测试范式选择表

2）被试筛选

为了提高实验结果的准确性与科学性，应根据被测产品的目标用户，有针对性地选取被试。筛选方法如下。

①按照测试车型的目标用户类型进行自然属性筛选。其中自然属性包括年龄、性别、驾龄、职业、收入、学历等。

②按照测试特殊要求使用被试行为属性筛选量表，对被试进行行为属性筛选。行为属性包括语言沟通、语言表达、喜好偏向。

③按照测试车型目标男女比例进行筛选。若目标用户男女比例有相应要求，则按要求进行筛选。若目标用户男女比例无特殊要求则按 1 ∶ 1进行筛选。

④用户进行智能网联汽车人机交互系统测试评价，至少需要 30 个被试；若测试方希望建立自己的目标用户数据集，则至少需要招募 70 个被试。

3）测试流程

测试流程如图 2.16 所示。

图2.16 汽车人机交互测试流程图

①签订知情同意书。在被试了解实验风险的情况下自愿签订知情同意书。

②向被试讲解实验要求及实验流程（要给被试培训）。向被试讲解实验要求及流程，确保被试清晰了解实验任务操作。

③协助被试佩戴仪器并进行仪器校准。

④在被试进行操作时同步进行数据记录和检测。在被试进行操作的过程中，测试人员须对采集的数据进行记录和监管，如发生问题须立即停止测试。

⑤填写问卷。在测试任务完成后，让被试填写问卷量表，得到主观评价数据。

⑥深度访谈。在测试任务完成后，主试根据测试任务及问卷量表的结果对被试进行提问，并通过视频进行全程记录。

4）测试设备配置

根据智能网联汽车人机交互任务选择对应的测试设备配置，各人机交互任务所需测试设备及用途，见表 2.18。

表2.18 信息交互测试设备配置

续表

注：表中测试仪器根据测试任务从表 2.12 中进行选取。

2.4.6 人机交互测试数据采集

1）数据采集前准备

根据测试对象与测试任务从表 2.12 中选取对应的测试设备，根据图 2.17 完成测试设备连接，然后进行测试设备校准。

图 2.17 测试设备连接拓扑图

设备与电脑正确连接并进行数据采集后，数据采集与预处理平台（如Dlab人机交互测试数据同步采集系统）界面如图 2.18 所示。

图 2.18 Dlab人机交互测试数据同步采集系统界面

2）人机交互测试客观数据采集

①人机交互任务测试客观数据采集，见表 2.19。

表 2.19 人机交互任务测试客观数据采集表

续表

②驾驶辅助任务测试客观数据采集，见表 2.20。

表 2.20 驾驶辅助任务测试客观数据采集表

续表

③驾驶接管任务测试客观数据采集，见表 2.21。

表 2.21 驾驶接管任务测试客观数据采集表

续表

3）人机交互测试主观数据采集

被试在完成测试实验任务后，主试人员依据易用性度量表、SUS满意度量表、形态满意度量表、功能满意度量表、交互满意度量表以及Panas情绪量表对被试进行量表主观评价测试，由主试人员进行记录。

需要记录的主观评价量表，见表 2.22。

表 2.22 主观评价量表

4）被试深度访谈

在被试完成模拟与实车驾驶人机交互测试实验后，主试通过深度访谈对被试在实验过程中人机交互体验进行主观评价询问，主试人员记录被试回答结果，如图2.19所示。

图 2.19 人机交互测试被试深度访谈

2.4.7 人机交互测试数据处理

1）测试数据处理

（1）主观测试数据处理

主观数据分为满意度数据处理与访谈数据处理。满意度数据包括形态满意度、功能满意度、交互满意度 3 个五级量表数据。

满意度量表五级数据按分数高低进行排列后可得到满意度密度函数。如图2.20所示，将用户满意度数据进行分类处理，可得到针对此产品的领先用户、随流用户及保守用户群体的满意度分布密度函数，可根据满意度分布特征获得三类目标用户对HMI产品交互体验的满意度、接受度。

图 2.20 满意度分布密度函数图

提取被试深度访谈数据中被试提到的高频词句，依靠主试经验进行统计分析处理。

（2）客观测试数据处理

①脑电测试数据处理。不论是EEG实验还是ERP实验，其数据都要进行如下处理。

首先进行脑电信号时域去眼电干扰，由于部分脑电信号记录了驾驶人的视觉信息，如观看交通标志、观察仪表盘等，这些动作可能导致脑电信号中掺杂由于眼部运动而产生的眼电信号，特别是在前额处所采集的脑电信号。因此需要去除眼电干扰。其去眼电前后对比如图 2.21 所示，示例数据。

图 2.21 去眼电前后图

其次进行脑电信号小波去噪，在去除眼电信号干扰之后，脑电信号中可能还掺杂其他噪声，因此还需要继续进行去噪处理。其小波去噪前后对比如图 2.22 所示。

图 2.22 小波去噪前后图

最后进行脑电信号频域处理，若研究EEG信号，则将对EEG信号进行频域分析和处理，提取出有效的特征指标，以此来反映驾驶人脑负荷情况，进而探究脑负荷特征指标与驾驶行为安全性之间的关系。其小波去噪后EEG信号与 4 种脑电节律波如图 2.23 所示。相关医学研究表明，α波、β波、θ波、δ波这 4 种典型的节律波能很好地反映大脑及人体活动状态，γ波在人清醒状态时不常见。不同脑电节律波的频率范围、幅值及表征含义都不同。成年人α波幅度大约为 50 μV，松弛或闭眼清醒时较明显，属于快波。β波幅度为 5 ～ 20 μV，常在注意力集中或情绪紧张激动时出现，属于快波。θ波幅度为 10～50 μV，与注意力控制机制、学习以及记忆功能有关，其能量一般随认知负荷增加而增强，属于慢波。δ波与睡眠有关，成年人δ波一般在深度睡眠阶段出现，属于慢波。这些数据可用于评价车载信息任务、辅助驾驶任务及有条件无人驾驶任务。

图 2.23 小波去噪前后图

②心电测试数据处理。实验过程中采集到的心电信号由于掺杂噪声而不能被直接利用，需要去噪。本文同样采用小波去噪方法对心电信号去噪，处理过程与上述对脑电信号去噪的过程相似。这些数据可用于评价车载信息任务、辅助驾驶任务及有条件无人驾驶任务。其去噪前后对比如图 2.24 所示。

图 2.24 去噪前后图

③眼动测试数据处理。首先剔除有问题数据，然后根据测试需求在软件中对数据统一划分兴趣区。根据需求对所需眼动指标数据进行分析。眼动数据处理分为热点图、轨迹图与瞳孔图。图 2.25 所示为热点图，眼动热点图主要用来反映被试浏览和注视的情况，热点图可展示出被试在刺激材料上的注意力分布情况。红色代表浏览和注视最集中的区域，黄色和绿色代表目光注视较少的区域。这些数据可用于评价车载信息任务、有条件无人驾驶任务。将多张热点图进行叠加，可得出主要关注区域。

图 2.25 多个被试眼动叠加热点图

图 2.26 扫视顺序图

如图 2.26 所示为被试眼动扫视顺序图。眼动扫视顺序图主要用来反映被试浏览顺序和注视的情况，扫视顺序图可展示出被试在刺激材料上的注意力分布情况和观看先后顺序。圆圈里上面的数据代表被试浏览的顺序，下面的数据代表注视集中的时长，圆圈越大，目光注视越多，停留时间越长。

④手指追踪测试数据处理。将手指操作行为视频导入分析软件中，剔除无用数据，处理过程与上述对眼动数据处理方法相似。手指运动轨迹主要用来反映被试手指操作情况，手指运动轨迹图可展示出被试在刺激材料上的手指运动分布和手指停留情况。红线越多、越密集、越杂乱，说明手指停留时间长、运动速度快。这些数据可用于评价车载信息交互任务完成的绩效、负荷评价，如图 2.27 所示。

图 2.27 手指触摸车载屏功能菜单的运动轨迹图

⑤瞳孔测试数据处理。人眼瞳孔大小是视觉功效研究的重要指标。眼动仪能记录瞳孔大小。为了方便分析瞳孔变化规律，需要对测试得到的瞳孔大小数据进行处理。数据可以反映被试执行任务时的认知情况，瞳孔直径越大则认知难度越大。

⑥表情数据处理。面部表情系统将情绪划分为 7 类：中性、快乐、悲伤、生气、惊讶、害怕、厌恶。 FaceReader ^TM 还支持面部表情分析过程可视化，无论是在实时分析的过程中还是在完成分析后，系统都会生成可视化的情绪强度的柱状图、情绪的环形模型的饼状图以及连续的情绪分析曲线结果图。此数据可用于评价辅助驾驶任务及有条件无人驾驶任务的用户满意度，如图 2.28 所示。

图 2.28 人机交互被试面部表情识别

⑦车辆行驶状态数据处理。剔除无效数据或偏差较大数据，将所需车辆行驶状态数据导入SPSS软件中，使用合适方法进行处理。其中包括横向加速度、纵向加速度、驾驶视野偏移率、TTC、TLC及方向盘转角，如图 2.29 所示。

图 2.29 人机交互测试评价车辆行驶状态数据处理

横向加速度表示与汽车行驶方向垂直的方向的加速度，是车辆在进行转弯行驶时产生的离心力所带来的加速度。转弯时横向加速度越大车道偏移越大。横向加速度越大，车越容易发生侧滑。驾驶视野偏移率表示驾驶时驾驶者视线不在道路前方的时间与视线直视道路时间之比。视野偏移率越大说明驾驶分心越久，危险越大。 TTC表示汽车碰撞时间，是指两车车距／两车的相对车速，数值越大，车辆行驶越安全。 TLC表示驾驶员从当前时刻位置到越过车道线所需的时间。方向盘转角表示直线驾驶过程中被试操作方向盘的角度，角度越大，车道偏移越大，驾驶风险越高。这些数据可用于评价辅助驾驶任务与有条件无人驾驶任务。

⑧驾驶员视频数据处理。主要处理被试操作行为数据。数据主要用于信息交互任务。可得到操作步骤数、试探步骤数、操作出错步骤数、完成步骤数。这些数据可用于评价车载信息任务。作者已开发专门的工具和软件采集处理分析，如图 2.30所示。

图 2.30 驾驶员手操作视频数据处理

2.4.8 人机交互测试结果评价

1）主—客观联合评价模型

主—客观联合评价模型将被试的多维度主客观数据同时用主客观数据共轭图和雷达图表示，可看出同一时刻人机交互测试主、客观数据的对照情况，为主—客观相关性分析评价提供数据依据。根据主客观数据建立雷达图模型，此图可直观分析人机交互测试主—客观评价结果的好与差，越靠近外圈，数据结果越好，各项指标评分越高，如图 2.31 和图 2.32 所示。

图 2.31 人机交互测试主—客观数据共轭显示

图 2.32 两款车机软件人机交互对比测试主—客观测试数据雷达图

2）主—客观测试评价指标相关性分析

选用Pearson相关系数，选择SPSS中相关性分析。将需要分析的两组或多组数据导入，进行分析。用字母 r 表示，其阈值为［－1，1］。相关系数 r 越接近－1 或 1，两个变量的负相关性或正相关性越强；相关系数 r 越接近 0，两个变量越不相关；相关系数 r ＝ 0，两个变量完全不相关。具体可分为如下 5 个区间：当| r |∈［0，0.2］时，两变量呈极弱相关或无相关；当| r |∈ （0.2，0.4］时，两变量呈弱相关；当| r |∈（0.4，0.6］时，两变量呈中度相关；当| r |∈（0.6，0.8］时，两变量呈强相关；当| r |∈（0.8，1］时，两变量呈极强相关。根据 5.2 人机交互任务，分别选择相符的主客观指标进行相关性分析，见表 2.23。

表 2.23 人机交互测试主—客观相关性分析

续表

3）总体评价（HMI评价指数）

HMI评价指数的构建：可根据层次分析法和模糊综合评价方法确定HMI评价指数。由于测试需求不同使用的测试指标不同，首先进行评价指标相关性分析，选出彼此独立的指标构成评价指标体系。然后建立评价因素与评语集确定模糊判断矩阵，用层次分析法确定评价指标权重。可得出各指标所占权重比例及 4 个维度所占权重比例。当HMI评价指数没有达到用户期望时，可分析 4 个维度的评价指数。其中绩效、负荷、满意与风险权重分别通过用户问卷打分与专家打分得出，每个维度下的指标也可通过同样方式转化，由此可知问题所在。

HMI评价指数的构成：HMI评价指数分为五级，HMI评价指数满分为 100。当HMI评价指数在［90，100］时，HMI测试结果很好。当HMI评价指数在［80，89］时，HMI测试结果较好。当HMI评价指数在［60，79］时，HMI测试结果一般。当HMI评价指数在［40，59］时，HMI测试结果较差。当HMI评价指数在［0，39］时，HMI测试结果很差。

4）测试评价报告

完成测试任务后提交测试报告。报告内容包括测试对象的详细描述、测试目的详细描述、测试指标的选取依据、测试设备选取以及测试环境搭建的过程、测试数据的处理方法、测试结果（可视化呈现）。若有HMI改进版本测试，则可增加改进前后对比测试评价报告，智能网联汽车人机交互测试评价报告封面和目录，如图 2.33所示。

图 2.33 智能网联汽车人机交互测试评价报告封面和目录