1.数据可视化的作用
数据可视化的作用包括记录信息、分析推理、信息传播与协同。
(1)记录信息
自古以来,记录信息的有效方式之一是用图形的方式描述各种具体或抽象的事物。图1-5(a)所示内容是我国的结绳记事,这种方式用不同粗细的绳子打成不同距离的结,其中的结有大有小,每种结法、距离大小以及绳子粗细表示不同的含义。图1-5(b)所示内容是甲骨文记事,甲骨文因镌刻、书写于龟甲与兽骨上而得名。经过加工和刮磨的龟甲和兽骨由专门负责的卜官保管,卜官在它们的边缘部位刻写上记述这些甲骨的来源和保管情况的记事文字。图1-5(c)所示内容是竹简记事,古人将文字刻在竹子做的木片上用来记录发生的事情。
图1-5 我国古代的记事方式
田径赛场上的裁判员通过图1-6所示的图可以清晰、准确、迅速地判定运动员的名次和成绩。
图1-6 田径赛运动员的冲刺
(2)分析推理
数据可视化极大地降低了数据理解的复杂度,有效地提升了信息认知的效率。这有助于人们更快地分析和推理出有效信息。1854年,英国伦敦爆发了一场霍乱,John Snow医生绘制了一张街区地图,如图1-7所示,这就是著名的“伦敦鬼图”。该图分析了霍乱患者的分布与水井分布之间的关系,John Snow发现在一口井的供水范围内患者明显偏多,据此找到了霍乱爆发的根源——一个被污染的水泵。
图1-7 伦敦鬼图
(3)信息传播与协同
俗话说“百闻不如一见”“一图胜千言”。图1-8展示了中国智能手机的出货量数据,我们从中可以直观地感受到2020—2021年手机出货量的变化情况。
图1-8 2020Q4—2021Q4中国智能手机出货量及增长率
图1-9所示为雅虎邮箱处理数据量的示意图形。雅虎邮箱每小时处理的电子邮件总量为1.2TB,这些邮件若打印出来,大约需要644245094张A4纸。这是一个很大的数据,但到底有多大?若644245094张纸被首尾对接,则可以绕地球4圈多。由此,我们就能深刻地感受到雅虎邮箱处理的数据量之大。
图1-9 雅虎邮箱处理数据量的示意图形
随着计算机技术的普及,数据无论从数量上还是从维度层次上都变得日益繁杂。面对海量而复杂的数据,各个科研机构和商业组织普遍遇到以下问题。
① 大量数据不能被有效利用,弃之可惜,想用却不知如何下手。
② 数据展示模式繁杂晦涩,无法快速甄别有效信息。
数据可视化就是将海量数据经过抽取、加工、提炼,通过可视化方式展示出来,从而改变传统的文字描述识别模式,达到更高效地掌握重要信息和了解重要细节的目的。
数据可视化在数据分析中的作用主要体现在以下几个方面。
① 动作更快。使用图表来总结复杂的数据,可以确保对关系的理解要比那些混乱的报告或电子表格更快。可视化提供了一种非常清晰的交互方式,从而能够更快地理解和处理这些信息。
② 以建设性方式提供结果。数据可视化工具能够用一些简短的图形描述复杂的信息。通过可交互的图表界面,各种不同类型的数据可被轻松理解。例如,许多企业通过收集消费者行为数据,再使用数据可视化来监控关键指标,从而更容易发现各种市场变化和趋势。例如,一家服装企业发现,在西南地区,深色西装和领带的销量正在上升,这促使该企业在全国范围内推销这两类产品。通过这种策略,这家企业远远领先于那些尚未注意到这一潮流的竞争对手。
③ 理解数据之间的联系。在市场竞争环境中,找到业务和市场之间的相关性是至关重要的。例如,一家软件公司的销售总监在条形图中看到,他们的旗舰产品在西南地区的销售额下降了8%,销售总监可以深入了解问题出现在哪里,并着手制订改进计划。通过这种方式,数据可视化可以让管理人员立即发现问题并采取行动。
2.数据可视化的意义
在DIKW模型所定义的数据转化为智慧的流程中,可视化借助人眼快速的视觉感知和人脑的智能认知能力,可以清晰有效地传达、沟通并辅助数据分析的作用。现代的数据可视化技术综合运用计算机图形学、图像处理、人机交互等技术,将采集或模拟的数据变换为可识别的图形符号、图像、视频或动画,并以此呈现对用户有价值的信息。用户通过对可视化的感知,使用可视化交互工具进行数据分析,获取知识,并进一步提升为智慧。
对数据可视化的适用范围存在不同的观点。例如,有专家认为数据可视化是可视化的子类,主要处理统计图形、抽象的地理信息或概念型的空间数据。现在的主流观点将数据可视化看成传统的科学可视化和信息可视化的泛称,即处理对象可以是任意数据类型、任意数据特性,以及异构异质数据的组合。大数据时代的数据复杂性更高,如数据的流模式获取、非结构化、语义的多重性等。
数据可视化的作用在于视物致知,即从看见物体到获取知识。对于复杂、大尺度的数据,已有的统计分析或数据挖掘方法往往是对数据的简化和抽象,隐藏了数据集真实的结构,而数据可视化则可还原乃至增强数据中的全局结构和具体细节。当然,数据可视化经常会陷入两个误区:一是为了实现其获取知识的功能而令人感到枯燥乏味:二是为了画面美观而采用复杂的图形。如果将数据可视化看成艺术创作过程,则数据可视化需要达到真、善、美的均衡,达到有效地挖掘、传播与沟通数据中蕴涵的信息、知识与思想,实现设计与功能之间的平衡。从这个意义上说,数据可视化体现出宽物善知的作用。