有研究表明,人来自外界的信息大约有 80%~ 90%是通过眼睛获取的,可以说眼睛是人心灵的窗口,通过这个窗口我们可以探究人的许多心理活动规律。另外,眼动具有一定规律性,而这些规律性揭示了认知加工的心理机制。由此可见,研究人的眼动是具有很大意义的。就目前来说,眼动研究出来的成果已经在心理研究、可用性测试、医疗器械设计和广告效果测试等众多领域发挥重要作用。
眼动(Eye Movements)实际上包括注视(Fixation)与眼跳( Saccade)两种最基本的运动。人们在看世界的时候自我感觉视线是连续的,但从眼动记录当中可以明显看出人的眼睛活动是跳跃式的,某些时候是短暂的停顿,称之为“注视”,某些时候是快速的移动,称之为“眼跳”。
关于眼球运动的研究已经有很长的历史了。在 19 世纪,爱弥尔·贾瓦尔(Emile Javal ,由Huey在1908 年报道)发现眼球并不像之前假设的那样,在看文本时持续的移动,而是短暂的、快速的移动,同时掺杂着短的停顿。这些发现被之后的眼球跟踪研究中的眼球跟踪技术所证实(见Rayner的一篇论文回顾,1978,1998)。这种短暂的、快速的运动和短暂的停顿就是如今所知的扫视(例如,眼球在固定物之间以 500 次及以上的速度,进行持续地快速地运动)和注视(例如,一个相对不动的持续 200 到 300 毫秒的注视,视觉注意力在一片视觉显示的具体区域内;Rayner,1998),它们仍然是最广泛应用的描述眼球运动的术语。
早期跟踪眼球固着位置的技术是侵害性的,包含着对大脑皮层的直接机械接触。最早的非入侵性的眼球跟踪是在Guy Thomas Buswell(1920)研究阅读与画作欣赏时产生的,利用眼球反射的光束并记录在胶卷上;Hartridge and Thompson(1948)后来发明了第一个头盔式的眼球跟踪器。眼球跟踪器现在有很多种类,不过它们主要代表了三种类型:侵略性的,比如一个埋置式传感器(在医疗诊断和眼球运动的生理研究中使用),将眼电图电极置于接近眼球的地方来记录电场的变量(对甚至是微小的扫视也很灵敏,能够在黑暗中和眼睛闭合时工作,已经被广泛地应用在睡着时的研究)。还有光学眼球跟踪器,反应眼球中的光线(一般是红外线),并通过摄影机或者一些特别设计的光学传感器来测量。最后一种类型既没有侵略性也不昂贵,所以最常用到。此外,它不仅支持质化研究也支持量化研究。
这些研究(包括那些在营销方面的)的兴盛,不仅仅是技术进步的结果,还因为将眼球跟踪数据与认知过程联系起来的心理学的重大进步(例如,Jacob and Karn,2003)。在Just和Carpenter (1976a, 1976b)的眼球-心理(Eye-mind)假说中,他们指出在人们的注视和思考之间没有可察觉的间隔,所以当一个人看一个字或一个物体,他也在认识和思考那个字或物体,时间与记录的注视时间相同。因此,注视的方向可以与注意力的集中相联系,这提供了一个过滤器官接收信息的手段(Deutsch and Deutsch,1963; Posner and Peterson,1990; Treisman,1964)。这个假说遭到了质疑,尽管现代研究已经系统地证实了,没有眼球运动的注意力转移是可能的(Posner,1980),并且只要注意力移到了新的位置,只要条件允许眼球也会跟着转移(Hoffmann,1998)。于是遗留的问题是,什么条件或特征使注意力转移到了特别的位置?视觉注意力之后的情感和动机过程的特点是什么?
人们常常聚焦于可能提供重要信息的物体上(Yarbus,1967)。注意力的移动依赖于任务的需要(Folk, Remington and Johnston,1992; Hayhoe and Ballard,2005),尽管一些因素更有可能捕捉到注意力,特别是具有更强生物意义的因素,比如活动的画面(Theeuwes,1994; Yarbus,1967),情感刺激(Calvo and Lang,2004)和人脸(Bruce et al.,1992; Young,1998)。人们对人脸的识别比其他任何视觉刺激都更快、更准确(Bruce and Young,1986),有证据表明如果脸部具有情感含义,那么对人脸的识别会加强(Öhman, Lundqvist,和Esteves,2001; Ohme,2003,2007)。
富有感情的信息比中立的信息更快和更长的捕捉人们的注意力(Calvo and Lang,2004; Nummenmaa, Hyönä, and Calvo,2006)。但是,对于刺激的情感效价人们并没有完全认同它的影响。有些研究者假设,只有高度进化意义的消极刺激可以促进认知进程,因为即使是在一个非常分心的环境中人们也能更快地注意到它们(Calvo and Lang,2004;Öhman, Flykt, and Esteves,2001)。不过大部分的证据表明,消极的和积极的刺激都能够抓住并保持刺激(Kolańczyk,2004; Nummenmaa, Hyönä, and Calvo,2006)。
眼球跟踪技术已经得到了良好验证,它能够确定视觉注意力的流动以及最吸引注意力的事物(Chanon et al. ,2007; Hollingworth and Henderson,2002)。眼球跟踪研究的记录可以揭示认识刺激物的不同等级(例如,哪些元素被更早地感知,哪些会推迟感知,哪些停留在外围或者没有被注意)和接触时间(例如,每个元素被注意了多长时间)。因为易于使用,各种研究领域都在使用眼球跟踪技术,比如认知心理学家获得以下几种数据时:视觉的、注意力的运动时间(Chanon et al. ,2007; Posner,1980),双眼运动中的同步和非同步(Altmann and Kamide,2009),以及认知速度和工作记忆(Mitchell, Macrae, and Glichrist,2002)。眼球跟踪技术提供了关于视觉感受的有价值信息,像对可视物体进行鉴定和分类( Hollingworth and Henderson,2002),或者判断到某处的距离和物体之间的距离(Currie et al. ,2000)。认知语言学研究使用眼球跟踪来认识阅读过程、语言理解,以及书写信息的清晰度(Gonzalez-Marquez et al. ,2005)。眼球跟踪也被用在人机界面中,以帮助残疾人和瘫痪人士(Abbot,2006)。在精神病学中,眼球跟踪在孤独症(Dapretto et al.,2006)和人格分裂症(Lezenweger and Gold,2000)方面有先进的研究。最后,眼球跟踪在商业用途中也大有用处,包括网站可用性、广告、产品及包装设计、汽车技术、电影、游戏,以及货架试销和商店试销(Brasel and Gips,2008)。
市场研究中第一次使用眼球跟踪是为了定性分析,包括单个人的数据分析和大型商店的研究,眼球跟踪可以分析出消费者在逛街的时候注意到了什么。在可用性研究(特别是网站的)中,眼球跟踪能够测定出网站界面、广告界面和用户界面的最佳间隔,以及特殊元素的可视性。最近几年,定性分析也调查了兴趣领域,比如中心视觉关注点的预选位置。这样的分析对测试包装设计特别有效,它可以检查出像商标或产品名称这样的重要元素是否显眼( Gofman et al.,2009)。
眼动有三种基本方式:注视、眼跳和追随运动(Pursuit Movement)。注视是指将眼睛的中央窝对准某一物体的时间超过 100 毫秒,在此期间被注视的物体成像在中央窝上,获得比较充分的加工而形成清晰的像。眼跳是注视点或者注视方向突然发生改变,这个过程中可以获得时空信息,但是几乎不能形成比较清晰的像。追随运动是指当被观察物体与眼睛存在相对运动时,为了保证眼睛总是注视这个物体,眼球会追随物体移动。从近年来发表的研究报告看,利用眼动仪进行心理学研究常用的资料或参数主要包括:注视点轨迹图、眼动时间、眼跳方向(Direction)的平均速度(Average velocity)、时间和距离(或称幅Amplitude)、瞳孔(Pupil)大小(面积或直径,单位像素Pixel)和眨眼(Blink)。其中,在前台界面所呈现出来的直观化的眼动指标主要有以下几个部分。
一是注视轨迹(Scan Path):记录被试者在整个体验过程中的注视轨迹,从而可知被试者首先注视的区域、注视的先后顺序、注视停留时间的长短以及视觉是否流畅等。
二是注视热点图(heat map):用不同颜色来表示被试者对界面各处的不同关注度,从而可以直观地看到被试者最关注的区域和忽略的区域等。
三是兴趣区分析:考察被试者在每个兴趣区里的平均注视时间和注视点的个数,以及在各兴趣区之间的注视顺序。
而在后台也可以输出相关数据,这些数据主要包括以下几个方面:
● 单一注视时间(single fixation duration)
● 首次注视时间(first fixation duration)
● 凝视时间(gaze duration)
● 总注视时间(total fixation duration)
● 眼跳(saccade distance)
● 回视(regression)
● 每一次采样周期时的视觉落点的坐标(X\Y)
眼动仪从大的领域方面说主要应用于以下相关的研究。
图 2-1眼动仪的相关应用领域
(一)眼科学研究
眼动与视觉信息加工的心理机制是心理学基础研究的主要课题。该领域中的基本理论主要是关于视觉信息加工与眼动的关系理论,特别是眼跳与注意的关系模型。 Godijn和Theeuwes提出了“竞争-整合模型”(The Competitive Integration Model)以解释外源性眼跳( excogenous saccades)与内源性眼跳( endogenous saccades)之间的竞争。该模型认为眼跳过程发生在一个共同的眼跳地图上,这个眼跳地图是动态的、可变的、心理性的。它是整合了来自不同方面(如内源和外源性)信息的结果。心理学家都承认注意与眼动的内在关系。注意是信息加工过程中普遍存在的心理机制,因此通过眼动过程了解注意的状态及其方向,可以为揭示信息加工的内部机制提供独特而有效的途径。
(二)阅读与语言心理学研究
心理学家对阅读的眼动研究可以追溯到 19 世纪,较著名的书有 1897 年Quantz的《阅读心理学中的问题》,1906 年Dearborn的《阅读心理学》和 1908 年Huey的《阅读心理学和教育学》。最近 20 多年来,随着认知心理学的兴起,心理学家开始重视眼动与知觉及其认知之间的关系。在阅读的研究中,心理学家利用眼动参数来反映认知加工的过程。
(三)图画观看、视觉搜索和模式识别研究
20 世纪 30 年代布斯卫尔(Buswell)对图画观看进行了系统研究,得出两种知觉模型:一种是一般查询模式( general survey),另一种是持续时间较长的注视。Yarbus(1967)以眼动为指标对图画观看进行了较广泛的系统研究。 Noton stark(1971)提出了一种视觉模式的知觉理论假设,并有证据支持。
模式识别是认知心理学在知觉领域中研究的重要课题之一。古尔德等(Gould et al. ,1965)考察了搜索数字的眼动模式,威廉姆斯(Williams,1966)在实验中发现,当只告诉被试要找的数字信息时,被试往往不表现出明显的选择性注视,当给出颜色、大小和形状三种信息的一种时,颜色信息使被试表现出明显的选择性注视。
(四)广告心理学中的研究
广告作为一种信息传递方式,其目的在于推销商品。广告心理学是将心理学的基本原理用于广告设计,通过对消费者的心理过程和特点的研究,设计出最能激起消费者购买欲的广告。人们通过测量多种心理效应来判断广告在消费者群体中产生的效果。测定广告心理效应的方法有:广告媒体的认知测量、广告媒体的记忆测量、视向心理测量和意见测量等。其中视向心理测量是广告心理学研究的重要内容,其测量中经常使用的仪器就是眼动仪。眼动仪可以将顾客注视广告时的眼动轨迹记录下来,通过分析记录的数据,可以清楚地了解顾客注视广告时的先后顺序,对画面的某一部分(分析结果时可以划分兴趣区间)的注视时间、注视次数、眼跳距离、瞳孔直径(面积)变化等。并以此来分析广告观看者的心理活动,这有助于广告商了解到广告受众是否按广告制作人的意图去注视广告,是否漏看了广告主(出资人)最为关注的诸如公司名称、商品名称及与众不同的特点,品牌标记等重要信息。通过眼动分析可以为广告设计者对广告布局(重要信息的位置)、插图和文案进行合理的安排提供有用的依据,也为评价广告设计效果提供了客观指标。
(五)动机与态度的研究
在相同情境下,记录被试的眼动信息,可以探测到被试对信息的选择取向,从而研究不同个体在相同情境下的动机与态度取向。比如对不同商品的注视时间等可以反映被试的兴趣志向和消费动机。
(六)发展心理学研究
通过记录不同年龄的儿童和青少年在各种不同条件下的眼动信息,可以探测其信息加工能力、学习能力的发展水平。如将眼动分析应用于学科问题解决的研究,则可以探究比较不同学生在解决各种问题时对外部信息的提取并由此推断其表征问题的过程和机制。
(七)工效学(Ergonomics)及艺术设计研究
在工程设计中经常要考虑人的因素的制约性。如视觉信息搜索的速度、范围及其快捷性等。眼动的工效学就是利用眼动指标来探测人-机交互作用中视觉信息提取及视觉控制问题,使设计符合人的身体结构和身心特点,实现人、机、环境之间的最佳结合。能够让人们更容易、更有效、更舒适和更安全地工作。
(八)交通心理学研究
眼动在交通心理学的研究主要涉及驾驶舱内的表盘设计问题、道路建设及路标设置问题、驾驶者在驾驶过程中的视觉信息搜索及其培训问题等。法国的Florence Hella在采用呈现信息的新技术研究汽车仪表盘时曾特别强调眼动分析的重要性。
构建驾驶员眼动特征的理论模型在驾驶行为的研究中非常重要。有人提出预测汽车驾驶员行为的模型——隐含马克夫动态模型(Hidden Markove dynamic models简称HMDMs),该模型可根据观察驾驶员的行为获取的眼动模式来推测驾驶员的行为意向,如注意路上的汽车情况,检查车的当前位置,将车的位置调到路中央等。因此这个分析系统具有实际应用价值。可以为智能汽车系统提供有用信息。
(九)航空心理学研究
航空心理学是心理学的一个重要分支。早在二次世界大战期间就已开始。它主要是研究航空环境中飞行员的行为特点和航空设备设计中人的因素问题。以眼动为指标的研究主要包括:一是航空环境中飞行员的行为特点;二是研究飞行器设计与使用者的人机关系问题;三是研究和训练飞行员的方法。
(十)体育心理学研究
在各种体育运动过程中,视觉信息的提取是其基本的心理支持。而视觉信息提取的不同模式可能正确反映了高水平运动员与一般水平(或新手)运动员之间的运动能力差异。所以记录不同水平运动员在运动训练或比赛过程中的眼动模式,有利于提供对新手进行有效训练的模式和策略。有些项目,如篮球、足球、乒乓球、冰球、高尔夫球、网球、台球、铅球、板球、体操、击剑、自行车和职业国际象棋等都可以利用眼动仪进行研究。
一般来说,现代眼动仪的结构一般包括四个系统,即光学系统、瞳孔中心坐标提取系统、视景与瞳孔坐标叠加系统和图像与数据的记录分析系统。
(一)品牌
目前主要的眼动仪品牌包括以下四家:一是瑞典的拓比(Tobill)公司;二是加拿大SR公司生产的Eyelink眼动仪;三是德国SMI公司生产的SMI眼动仪;四是美国Arrington公司生产的Arrington眼动仪。每一家除了生产相关硬件设备外,都有自己的相关软件作为支撑,如拓比(Tobill)眼动仪自带的(Tobill) studio软件系统。
图 2-2 眼镜式眼动仪的基本组成部分
(二)安装样式
从安装样式上可以分为以下几个类别。
图 2-3 不同安装样式的眼动仪
一是头盔式。头盔上装有红外光源、红外线摄像头、半反半透镜和景物摄像头。红外线通过半反半透镜照射到受试者的眼睛上,被反射回来的红外线通过半反半透镜投射到红外线摄像头,红外线摄像头通过测量眼睛反射的红外线确定眼珠和瞳孔的位置,计算出眼珠的水平和垂直运动的时间、距离、速度及瞳孔直径。另一个景物摄像头摄取被测者注视的物体。摄像机追踪虹膜和瞳孔上的角膜反射对头部相对运动进行补偿。
二是桌面遥测式。具有眼睛和头部的自动探测功能,允许受试者在测试过程中短暂地离开摄像头的测试范围,再回来时,摄像头能自动地继续摄取受试者的眼睛图像。此型眼动仪对受试者头部没有束缚,长时间测量也不会有太多不适。
三是便携式桌面眼动仪。采用USB接口供电,是一款完全可自由移动的眼动追踪系统。此系统灵活便捷,能够非常轻松地实现安装在笔记本电脑、台式机以及各类显示器上。
四是眼镜式。设计外观自然,佩戴舒适。系统不受环境限制,被试者可随身携带并可以自由活动,对使用的环境和使用者的活动范围没有限制。该系统可以广泛应用在公共设施设计、货架摆放、移动设备测试、体育训练、人机交互等深度应用领域。
五是高速托架式。测试托架用于固定受试者头部以获得更高的测试精度,此型眼动仪适用于阅读研究等需要较高精度的眼动测量。受试者将下颚放在安装了红外灯和摄像头的托架上,注视前方刺激呈现计算机屏幕上的图形。
(三)采样频率
不同的眼动仪记录相关眼动的频率不同,分为 50Hz、60Hz、120Hz、300Hz乃至1250Hz等,不同的采样频率,精度也不一样,如50H不同表示1 秒内记录50 次,每20 毫秒记录一次。
(四)差别与比较
加拿大SR公司生产的Eyelink眼动仪和瑞典生产的Tobill眼动仪是当前非常主流的眼动仪器,同时在国内也是卖得很火的两款眼动仪器。下面具体谈谈两者的差别。
一是用户群的性质。 Eyelink眼动仪的客户以科研机构为主,特别是以阅读为主要研究内容的研究者;Tobill眼动仪客户更多是公司,特别是需要可用性测评,界面、人机交互测评的公司。
二是定位校准操作。 Eyelink眼动仪校准分类很多,如三点、五点、九点校准,要经过连续两次校准,即校准和微校准,每个校准点的偏差角度都会呈现出来。研究者可根据研究需要选择校准的类型和精确度。因此眼睛注视点的位置定位比较精确,但是,定位时间比较长。 Tobill眼动仪定标快捷方便,只在屏幕上呈现 5点,只需要 10 秒钟就可以完成。因此,定位精确度逊于Eyelink眼动仪。 Tobill眼动仪一般只需要一次校准,在实验过程无法中途停止试验,重新定位校准。而Eyelink眼动仪在整个实验过程中都可以根据需要重新定位校准。
三是便携性和组装快捷性。便携性是Tobill眼动仪最大亮点和吸引购买者眼球的最大优势。 Tobill眼动仪可以放在一个旅行箱内,便携性好。并且组装方便,熟练的情况下,在 5 分钟内就可以组装完成。 Eyelink2000,Ⅱ眼动仪基本上固定在实验室里的,如果要带出实验室的话,是一项不小的工程量,一是东西太多,二是组装起来很麻烦,因为连线太多。
四是配套软件。 Tobill眼动仪的软件界面很漂亮,和苹果电脑操作系统的界面类似,非常直观。编程和数据分析均在同一个软件上,使用起来比较容易,新手也容易上手。但是,提供的眼动指标有限,再加上记录频率有限,也限制了数据的丰富。 Eyelink眼动仪的软件界面很朴素,与Windows 2000 和XP操作系统界面类似。但是配套软件非常多,如有主试机上有一套软件程序,被试机上有实验程序编辑软件(EB)和数据分析软件(Data view)。
Eyelink眼动仪实验程序编辑软件能实现很多功能,特别是一些需要高精度和极速反应的实验,它能很好地实现。此外,Eyelink眼动仪数据分析软件(Data view)功能非常强大,可以提供很多眼动指标,特别适合需要高精细分析的实验。也可以根据自己的需要,创造新的指标。
五是记录情况。 EyelinkⅡ眼动仪可以单眼和双眼记录,Eyelink1000、2000 眼动仪器只能记录单眼。在实验中,有托架让被试的头部固定,因此也比较自然。但是对于年龄较小的被试如 10 岁以下的儿童来说,Eyelink眼动仪做起实验起来则比较困难。 Tobill眼动仪全自然状态下的眼动追踪系统,全自动双眼追踪,双眼采集。 Tobill眼动仪可以自由移动头部,可同步记录面部表情和声音,适合从新手儿到成人的所有年龄段。
(五)眼动仪的局限及争议
目前,围绕眼动研究方法的争论一直没有停止,以下是一些相关争议的焦点。
一是“所看”是否就一定等于“所想”。因为人们有时候眼神在呆视而实际上大脑在神游。所以说,仅仅知道人在看什么,并不等同于知道他(她)在想什么。对此,心理学者提出了大脑-眼睛一致性假说,指的是人们所看与所想的通常是一回事。尤其是人们专注于某一特定任务时,这个假说通常是成立的。有此前提,我们才能够接纳眼动研究的可靠性。
二是用户关注焦点可能不是用户的兴趣点。假如用户的视线长时间停留一定就是用户感兴趣吗?长时间停留有两种可能:一是用户看到了感兴趣的东西,而且集中精力地看;也有另外一种可能是用户对某些内容感到困惑,不得不花时间理解。单纯就眼动数据而言,研究人员难以辨别到底是哪一种情况。因此使用眼动研究的一个重要的原则是不要单纯依赖于眼动数据。要了解用户所想,必须通过问询或其他方法进行。研究人员要结合多种研究方法来解读眼动的数据。
三是眼动实验的被试数量。被试的数量是决定研究质量的决定性因素。一般说来,至少一个实验组需要不少于 30 名被试
(有研究使用 25 名被试也能取得一定的效果)才能取得具有研究价值的数据。这是非常关键的。不少研究为了节约成本,被试数量严重不足,其结论的价值自然大打折扣,甚至是伪研究。也有研究者认为被试数量不是根本问题,关键是实验变量得控制以及实验本身得设计,有些可用性问题不一定非要被试多就好,尼尔森公司曾经使用“5 个用户”就进行足够的论断的研究课题。
四是数据的解释。眼动数据分析一大危险在于那些看起来很酷的热度图、柱状图很容易勾起“合理推断”。如果没有同时收集用户的诠释,一不小心就变成研究员的自说自话了。同样的,一旦钻进了数据的迷瘴,会忘记其实还有其他分析的利器。同时还要注意相关数据的多样化采集。比如,做眼动实验的时候也记录用户的行为、鼠标事件、时间、出错等,进行后测,这些数据综合起来,对研究的结果可以相互支持和印证。现在眼动设备的软件都具备这样的模块,不妨结合起来使用。
五是霍桑效应的存在。被试感觉到主试人员的存在会影响到测试。霍桑效应造成的偏差,在用户测试时一定要注意。如果实在无法避免,在定性分析数据时要考虑进来,将霍桑效应(Hawthorne Effect)对测试结果可能的影响记录下来,防止数据的偏差给查看结果的人造成误导。