伴随着计算机技术的发展,各行各业积累的数据不断增加。截至2022年6月,我国网站数量为398万个 ,如此多的网页,一个人一辈子也看不完。因此,把数据以某种方式组织起来制作成图表等易于理解的形式,能够有效提高数据沟通效率,从而使AIGC生成的内容更容易被读者理解。在本节中,我们将首先介绍数据可视化的概念,其次提出数据可视化的十条建议,最后展望数据可视化的未来。
数据可视化是信息和数据的图形表示 。通过使用图表等可视化元素,数据可视化工具为用户查看和理解数据反映的趋势、查找异常值等提供了一种绝佳的方式。在大数据时代,数据可视化工具和技术对于分析海量信息和做出数据驱动的决策至关重要,一个好的可视化图表甚至能够讲述一个故事。
数据可视化技术是指利用人眼的感知能力,对数据进行交互的可视表达,以增强认知的技术。
如今,数据可视化的快速发展极大地改变了企业的格局。随着数据总量的不断增大,大数据概念开始出现。大数据可视化可以用来描述几乎任何类型的数据,如数字、函数、代数、几何、算法、编码、图形等。它不再是简单的气泡图、直方图、饼图,而是通过更复杂的表现形式帮助决策者识别数据的关联。大数据技术使信息识别变得更容易,揭示普通可视化中人力找不到的关联,更加高效地帮助决策者进行决策。
在数据可视化过程中,用户往往会遇到不少难题。例如,如果所有对象的颜色都非常相似,那么用户就很难理解其中的区别;如果横轴或纵轴被故意拉长,那么可能会误导用户。实际上,许多视觉效果的问题都可以通过一些简单的步骤来改进或者避免。我们根据Stephen等人的论文,总结出数据可视化的十条建议 ,如图2.10所示。这十条建议旨在帮助数据可视化的创造者改进视觉信息呈现效果,帮助用户获得更好的阅读体验。
1.构思图表
在开始工作之前,首先应该考虑这样一个问题:图表传达的核心信息是什么?这些信息又将如何论证观点?你的目标是显示数据的对比、排名还是变化?假设要对一条主干道每小时的车流量进行调查分析,那么就应该明确数据可视化的目的——是将数据以小时为单位排列,还是以天为单位排列?是想比较同一天高峰期和低谷期的车流量,还是比较不同天高峰期的车流量?
图2.10 数据可视化的十条建议
2.选择软件
数据可视化效果通常需要一个或多个软件来呈现。为了生成更好的可视化效果,用户可能需要花费金钱和时间学习使用新软件。如果选择功能较为简单的软件,那么数据可视化效果也许会大打折扣。
3.使用几何图形
几何图形是数据可视化过程中常见的图形,比如用条形几何创建的条形图。将几何图形直接与集中的数据进行配对,可提升数据可视化效果。
4.使用颜色表达
颜色对于阅读体验的影响较大。用户如果在白纸黑字中看见一些彩色,可以提升阅读体验。常见的配色方案有顺序、发散或定性方案。在顺序配色方案中,颜色从亮到暗,用一种或两种相关色调来传达信息变化,或者使用两个极端颜色作为对比;发散配色方案的经典例子是从红到蓝的渐变,比如在美国大选中显示美国各州对两党的支持度;定性配色方案则是使用不相关的颜色来表达群体之间的差异。
5.包含未知性
人类社会中存在许多不确定性因素,数据可视化也是如此。几何图形太容易误导用户,例如误差条和阴影间隔、方框图或分布图每段的长短不同。正确的图表应该包含不确定性因素,这样才能让用户进行多角度思考。
6.小而多组图
一种特别有效的数据可视化方法是重复一个图形以突出不同图形之间的差异,这种方法也称为小而多组图。小而多组图背后的设计策略是在同样的数据中,差异更容易显示。当图像中的变化较为细微,或是制作者想要突出变化的时候,就可以使用这种策略。
7.区分数据与模型
在学术论文中,所有原始数据都必须完整呈现。可是,如果将所有数据都转化为可视化图表会过于臃肿和烦琐。用户应当考虑,究竟哪些数据更能体现论文的结论?显然,只有那些重要的数据才应当被制成图表。
8.数据标注
制作可视化图表很重要,和它同样重要的是详细解释图表中的信息。《美国医学杂志》上的一项研究发现,超过三分之一的论文中的图表无法自我解释 。对于那些较为复杂的图表或模型,应使用更多文字作为标注,负责向用户解释信息。
9.考虑信息图
信息图是一种数据可视化表现形式,它可以将数据、信息或者知识集中在一张图上来展示。制作信息图的目的是将需要传达的数据、信息或者知识以图像的形式表现出来,让用户一目了然。
10.意见反馈
在完成可视化图表制作后,制作者怎样才能知道可视化效果好不好呢?最简单的方式就是寻求他人的评价。数据可视化效果应当从三个方面来评价:首先是正确性,即数据必须是真实可靠的,应当避免歪曲结论;其次是高效性,好的数据可视化效果应当尽量删除无关的内容,防止用户的注意力被吸引;最后是美观性,好的数据可视化效果应当能够激发读者的主动性,这就需要制作者从艺术的角度来进行设计和思考 。
AIGC技术可以生成图像,因此它也被认为是数据可视化技术的一种升级版本。目前,AIGC在数据可视化领域已经产出一定的成果,大部分AIGC的数据可视化案例都来自元宇宙。
元宇宙需要强大的计算能力来满足各种功能和服务需求,计算能力将决定元宇宙的上限。计算能力包括高清3D渲染计算能力、低延迟网络数据传输能力、多种类型的物理模拟能力,而要实现这些功能都需要数据可视化作为基石。同时,元宇宙还使用AI进行人机交互。只有拥有强大计算能力的AI才能构建高度逼真的数字世界,实现数亿用户之间的实时交互。用户的诉求对元宇宙计算能力的运行提出了更高的要求,而只有AIGC技术才能帮助元宇宙满足这些要求 。
例如,在元宇宙中,数字孪生辅助驾驶技术能够协助自动驾驶技术发挥作用,帮助元宇宙建立更加可靠的交通系统。数据和AI算法对于数字孪生辅助驾驶技术都至关重要。Niaz等人通过数字孪生辅助驾驶技术开发出自动驾驶的框架。他们使用V2X通信连接虚拟空间和物理空间,以提高驾驶安全性和交通效率。不管是纯虚拟驾驶、传感器数据采集还是驾驶模拟,都可以在这个框架中运行 。