如果想要使用交互式可视化数据分析系统成功地分析数据,那么就不能仅仅局限于随便创造一个可视化图形、使用蹩脚的人机交互机制以及落后的计算机。这样的话,交互式可视化数据分析也就没有了任何意义。若从一开始就偏离了大方向,最后会导致完全错误的结果。
以图2.1(a)为例,图中统计了2017年的德国居民生活满意度。强度从0(非常不满意)到10(非常满意)逐步递增。图中分别用红色、黄色和绿色表示每个地区的平均满意度。粗略一看,似乎德国东部地区的人们生活满意度比较低,但这个初步结论没有数据支持,所以说明本图形还存在缺陷。如果我们仔细观察的话,会发现德国全部地区的生活满意度都介于6.83到7.43之间,这意味着人们更接近于满意而不是不快乐。
图2.1(b)才是一个合格的图形。根据从0到10的区间的不同程度赋予不同颜色。改进过的图形显示,绝大多数德国人都对生活比较满意,不同地区之间只有轻微的差异。
图2.1 德国居民对生活满意度的统计数据图
上述示例让我们不禁思考,到底什么样的图形才能提高数据分析的效率?实际上,我们很希望能够对交互式可视化数据分析方案的分析质量进行统一评估。但是它通常会受到数据特征、分析目标、用户、人机交互系统和办公环境等很多因素的影响。这些因素本身就是一个个复杂的小系统,很难赋予统一的定义,所以也就无法真正地进行评估。但是我们可以建立三个质量标准,用以规范交互式可视化数据分析系统。
首先,交互式图形系统必须要具有表达性。一组合格的图形一定要能够将信息清晰明了地表达出来。我们通过图形化的数据和可行的操作来评估该交互式图形是否具有表达性。要做到这一点,显然就要分别评估图形表达的清晰程度和交互操作的难易程度。
如果某组图形能够明确地将我们所需的信息从数据中传达出来,并且不附带任何其他冗余信息,那么我们就可以认为这组图形具有表达性。换句话说,合格的交互式图形既不捏造也不隐瞒信息,而是客观地反映我们所需的信息。
同时,如果交互系统允许我们执行获取指定目标信息所需的操作,并且只允许执行这些操作,那么我们就可以认为该交互系统具有简易性。换句话说,用户使用该交互系统能够准确地获取需要的信息。
其次,交互式图形系统应该具有良好的效果。有效性属于以目标为导向的特征,我们是否能获取信息在很大程度上取决于交互式图形的有效程度。
如果交互式图形系统符合我们的生理特征和感知能力,也就是我们的看、听、反应以及行为能力等方面,那么就可以认为该系统具备有效性。在我们使用交互式可视化系统来分析数据时,应该和调动自身生理行为和感知行为一样自如。从这个意义上来说,该系统的有效性直接决定我们能否从图形中获取指定信息。
同样,有效性也可以表达人机互动的程度。大多数情况下,有效性与我们的动作机能相关,比如以不同的速度移动手指、手臂和身体的能力。有时也会涉及语音控制方面。
最后,交互式图形系统应该具备高效率。无论从哪方面来说,高效性都是一个理想的特征。同时,高效性也带来了经济意义:交互式可视化系统带来的经济收益要远大于所要付出的人力成本和设备成本。
说到了成本,我们还是更关心计算数据并将其转换成可视化图形所需要的时间成本和计算机配置成本。另外,换一个大尺寸显示屏或者是组成多屏幕显示环境也能够提高工作效率。
对于用户来说,他们最关心的就是可视化图形的视觉效果和操作的难易度。虽然解读可视化图形主要是脑力劳动,但是也需要调动眼力。另外,操作设备时需要进行体力劳动,但同时也需要心理活动来参与规划和协调身体。
以上所述表达性、有效性和高效性这三个标准有助于我们准确评估交互式可视化数据分析的质量。表2.1对此进行了概括。
表2.1 交互式可视化数据分析的质量标准
大家请注意,我们在介绍这三个标准时的顺序是将“表达性”放在首位的。无论我们的分析系统效果有多好,速度有多快,但如果可视化图形显示得一塌糊涂的话就前功尽弃了。所以表达性牢牢占据着第一的位置。早在1983年,塔夫特(Tufte)就将表达性定义为一个合格可视化图形的基础标准 1 :
让数据显示出来才是重中之重。(塔夫特,1983)
尽管有了这三个质量标准,我们依然很难对交互式可视化数据分析有一个标准的评估,这方面需要大家有清晰的认识。尽管在诸如计算时间和屏幕尺寸等方面可以设立量化标准,但在其他方面却无法做到。例如,可视化图形数据的优势无法量化,但我们却要根据它来确定效率。另外,每个用户都是拥有独立认知、各自世界观以及思维方式的个体,每个人都不一样,所以我们无法提前获知他们的目标数据和工作任务。
尽管如此,这三个质量标准依然为我们提供了一个基础规范方案,我们可以借助该方案来调整相应的图形、交互系统以及数据计算参数。