购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一节
人机交互

一 核心概念

国际计算机学会ACM(Association for Computing Machinery)于1992年给出了人机交互的定义:Human-computing interaction is a discipline concerned with the design,evaluation and implementation of interactive computing system for human use and with the study of major phenomena surrounding them。可见,人机交互(Human-Computer Interaction,HCI)是一个计算机术语,泛指的是用户与具有计算能力的系统之间的信息和行为互动。随着计算机技术的不断进步,人机交互中“机”的外延也在迅速拓宽,近十年普及的智能手机、可穿戴设备、虚拟现实、遥控机器人、语音输入、图像识别、云计算等应用,均为人机交互增添了新的场景。

人机交互的属性决定了其必然涉足交叉学科,最早是计算机学科(Computer Science)与人因学(Ergonomics)的交叉,研究人类在计算机技术构建的环境、产品以及服务影响下的身体和心理状态。随着科技的不断发展,认知心理学、社会学等逐渐被引入人机交互的研究中。如今,人机交互的外显和内涵越来越丰富,更多的领域开始以交叉学科的视角对其开展跨学科研究。

二 人机交互的情境变迁

人机交互的进化史实质上就是交互情境的变迁史。人机交互情境是将人与机连接起来的媒介,在不同的技术条件下,用户通过不同的情境与计算系统进行交流。从历史纵向来看,人机交互的情境变迁总体呈现从厚重到轻便、从烦琐到简洁、从单一感官到多元感官、从“人帮助机器理解”到“机器主动理解人”的特征。

早期人机交互的典型是人与计算机的互动,人类必须面向庞大的机器,要想实现特定的计算功能,必须手动输入指令,且指令烦琐,人类是人机交互的绝对主体,是交互行为的发起者和决策人。一直到DOS操作系统时期,人机交互的情境变得更为精练,特定计算功能对应的指令也已经大大精简,人机交互的效率有了一定提升。

微软推出的基于视窗的Windows操作系统让人机交互进入一个新的天地。与之前的人机交互相比,Windows的最大特征就是“所见即所得”,人机交互的媒介不再是一大堆让人难以识记的指令,而是鼠标指针、图形、图像、文字,显然这大大降低了人机交互的门槛。人机交互的便利推动了计算机在民众中的迅速普及,用户不需要具备专业的计算机知识,也能够很容易学会常用的操作技能,人与机器的交互不再是高、精、专的标配,更多的普通用户得以参与人机交互。

接下来人机交互进入互联网时代。移动互联、触摸屏手机进一步促进人机交互向更便捷、更直观的趋势发展。然而,不管是Windows的图像情境,还是手机移动互联的“指尖上的互动”情境,人机交互的主动权依然牢牢把持在用户手中,用户发号施令、机器遵照执行的人机交互方式仍是主流;反映在信息传播领域,就是用户必须去主动获取信息,机器不能主动向用户提供信息服务。

直至算法和大数据引领的人工智能时代的到来,人机交互的情境开始有了质的转变。

随着人工智能、大数据、生物传感等技术的应用,人机交互的情境已经发生了巨大变革。2016年,Google旗下DeepMind开发的AlphaGo击败人类顶尖围棋手,引得举世瞩目。2017年10月,《自然》发布消息,升级的AlphaGo Zero能在无任何人类输入的情况下迅速自学围棋,棋力让人叹为观止。智能时代的人机交互已经迈过“命令—行为”的以人作为控制主体的阶段,人机共生、机器在一定条件下的主动思考不再是天方夜谭。

基于现实的交互(Reality-based Interaction,RBI)是新一代人机交互的典型特征,常见的典型应用包括虚拟现实技术(Virtual Reality,VR)、增强现实技术(Augmented Reality,AR)、文本感知计算、感知和情感计算、语音交互等;如虚拟现实游戏,就为用户提供了基于视觉和触觉的交互情境。Windows10的智能语音助手“微软小娜”(Cortana),能够通过记录用户的使用习惯,利用云计算和非结构化数据分析,从而理解用户的语义,实现有效的语音理解。新闻聊天机器人将情感识别技术运用于分析用户在阅读新闻、广告、杂志时的感情变化,从而精准识别各类文本信息对用户的即时影响。谷歌眼镜、智能手环等可穿戴设备能够利用数据交互、云端交互等强大功能,时刻记录用户处于某种行为状态时的各类参数。

相比之前的人机交互,智能技术下人机交互的属性向着认知、创造力、个性化的更高层次转变,用户界面不必“可见”,机器的交互和学习过程在潜移默化中就能完成,机器向用户提供舒适的应用情境和愉悦的体验。这种自然交互技术的发展更多涉及人在生理、认知、情感等方面的属性,在深度和广度上都超越了以人为交互主体的水平,用户可以更好地感受人机交互对自身深层次需求的满足,以及机器施予的“自然人”对话体验。 [1]

总之,在第四次工业革命的浪潮下,智能技术已经融入人类生活的各个领域,人机交互的频率也越来越频繁。移动互联让用户随时在线,触屏让人机交互变得无障碍,人工智能让机器更好地理解用户的意图,从而提升人机交互的有效性。

可以预见,面向智能时代的人机交互的目标必定是更为和谐、自然的人机共生,这迫切需要人类的认知机理、心理规律、行为范式等与计算机的内置算法深度互联,智能算法可以解释、预测并且良性引导用户的行为,在各个领域的智能应用和人机交互中辅助人类实现更好的社会效益。

三 认知心理学与人机交互的高度关联

认知心理学(Cognitive Psychology)是20世纪50年代在西方兴起的一种心理学研究方向,在广义上是研究人类的知觉、表象、记忆、创造、思维等认知层面的高级心理过程,在狭义上则是从信息加工的视角研究人类认知事物的过程。可以说,从信息加工的角度研究人类认知过程是现代认知心理学的主流,从总体上看,认知心理学将人视作一个信息加工的系统,认知的本质就是对信息的处理和加工,对信息输入进行编码、有条件地进行贮存和有目的性地提取是认知的主要环节。 [2]

人机交互的过程与认知心理产生的过程是高度一致的。从认知心理学的视角看,人机交互可以分为一系列阶段,每个阶段都是人与计算机进行信息交互的环节,人从信息交互中获得对事物的知觉并产生表象,在长期的交互后形成记忆,并逐渐在人机交互中试图创造性地进行信息再生产和利用,在实践后形成具有自我特色的思维模式。人与计算机在每个阶段都会进行信息的特定交互,双方会根据彼此的反馈做出下一阶段信息的决策行为,互动即这一系列阶段的构成主体,人机交互中信息加工系统的各个阶段之间以某种方式相互联系着。可见,人机交互在一定程度上就是认知心理的过程。 [3]

从仿生学的角度,计算机对信息的感知、记忆和处理的过程实际上是在模拟人对信息的感知、记忆和处理的过程。计算机对人输入信息的感知必须符合人的既有认知,例如,在DOS的环境下,用户输入“Format”指令,计算机能够判断是要进行格式化操作,输入“Dir”指令,能够判断是要进行查看目录操作。在Windows环境下,用户对可执行文件做出“鼠标双击”的操作,计算机能够识别出用户需要执行该程序的意图。计算机能够辅助用户对信息进行记忆和存储,如Windows的文件夹、文字资料归档和保存、图片(视频)制作和存储等,而这些载体都是对用户生理舒适感的延伸。人机交互的重要目标是减轻人的工作负荷,从笨重的台式机到笔记本电脑,再到如今的各类移动终端,无不如是。伴随第四次工业革命而来的人工智能、大数据、机器学习等技术,则可以让计算机中的智能程序更“懂得”用户,实现信息功能的定制和自动过滤,将用户的思维和行为能力延伸至计算机程序中,对此,麦克卢汉早已有“媒介即人的延伸”的生动描述。

从仿生角度开发的人机交互应用会更多地出现在新闻传播领域,如新闻推送就是各类应用平台在模拟用户对新闻信息的选择,VR新闻把用户的视觉和听觉带到尽可能逼真的遥远现场,“微软小娜”能够为用户提供基于语音的交互情境,而智能穿戴设备则让用户的情感需求能够与计算机智能应用直接关联起来,生物传感的人机交互情境不再只是科幻题材。

从认知心理学的角度看人机交互的表象和变迁史,可以发现其实质就是人与计算机之间相互感知、知觉、理解的进化史,传统的“以机器为中心”向“以用户中心”转移。在传统的人机交互情境中,用户必须调适自身的各项能力,如计算基础、编程能力、数理知识等,以适应计算机对用户的能力需求。随着科学技术的发展,人机交互的情境逐渐向“计算机适应用户”迁移,计算机慢慢变成用户的伙伴甚至是“知心人”,用户不必再通过繁杂的指令或一系列烦琐的操作才能让计算机为自己服务,而是计算机能够主动感知用户的交互意图,推演用户潜意识下的意愿和情感,并“贴心”地提供用户可能需要的各类服务。

归根结底,将认知心理学应用在人机交互的研究中,实际上就是创新、想象和预测用户是如何与计算机系统交互的,怎样的人机交互界面和情境才是高效、友好的,最终指导人机交互的设计者设计出用于适配用户情感、认知需求的人机交互系统。 tC4XuHmdL2oewKr7jP0SHsuEadRk6kHSt13tclZpQ2Rl4pF0vSY14b4qSXld84iR

点击中间区域
呼出菜单
上一章
目录
下一章
×