购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

在现代社会,大数据已经越来越引起人们的关注。我们经常能听说各种数据分析程序和算法带来了什么样的好处、怎样实现更高效的操作,还有怎样在各应用领域起到不可替代的作用。这些都说明了从数据中获取信息很容易,尤其是该领域的学者们都对此满怀信心。但是从庞大而复杂的数据中获得真正有价值的信息实在是一项艰巨的任务。在很多情况下,数据分析过程中的新发现、判断数据价值以及结果的有效性都少不了人的参与,只有人才能具备深层次的专业知识和常识。那么,如何能让人也参与其中呢?

有一种方法就是数据的可视化,也就是将数据转化为图形,然后用人类那神奇的大眼睛观察图形并且分析信息。但是,可视化也有一定的局限性,比如,庞大的数据集会导致图形的排布变得密密麻麻、混乱不堪,再比如,包含100多个节点的网络图形实际上看起来就像一团乱毛线。为了解决这个问题,我们在可视化技术的基础上引入了交互功能:也就是赋予人控制权。经过一整套设计之后,交互式可视化系统就可以应对大数据了。但是,如何在拥有上百个属性的数百万个样本的数据集中厘清它们之间的关系?统计学、机器学习和数据提取领域中的自动查找和相关性分析等方法倒是也堪用,但不可避免地会丢失一些重要信息。因此,交互式可视化数据分析(也称为可视化分析)的宗旨就是将可视化、交互和自动化分析等方法组合在一起来探索大数据。

就这么简单?当然不是了。设计有效的可视化数据分析系统绝非易事,其中需要各种各样的专业知识、技能和经验。除了纯粹的技术,还涉及许多其他方面。对于这样一个系统的每个组成部分,都有各种各样的替代解决方案,在选择解决方案之前,首先需要透彻地了解它们的优势和局限性。当标准方案没办法解决问题时,就要用创新思维另辟蹊径。任何系统的开发实际上都是一个设计的过程,重点是要对这个过程有深刻的理解,同时还要满足潜在用户的需求。

在教学生开发用于可视化数据分析的交互式系统时,老实说,我很纠结。我不知道是否应该引导他们去了解不同数据的不同可视化、交互和分析技术的所有组合。如果这么做了,那这门课就会变得枯燥且漫长。我真正想要的是一本非常简洁的教科书,其中包含整个设计过程、相关学科和结合方式,再加上一些高级的例子。

当克里斯蒂安·多明斯基(Christian Tominski)和海德伦·舒曼(Heidrun Schumann)告诉我他们已经写好了这样一本书时,我非常高兴,而真的读到时更是心情无比激动,这就是我想象中的书。当然,现在有很多关于可视化、交互和数据分析的书,但是那些书通常是重点讲述了某个单独方面,很少有全方位的介绍,而本书的真正价值就在于它能够涵盖交互式可视化数据分析的所有方面。作者们在可视化研究领域和开发现实世界解决方案方面拥有丰富的经验,书中的许多例子都来源于他们的亲身经历,这也让我们有机会了解专家的想法。他们在不同的领域攻克了许多复杂的案例,比如动态地理空间数据。所以本书中的例子都具有极高的应用价值。

除了在研发方面的经验外,作者们也非常善于表达专业知识:他们与沃尔夫冈·艾格纳(Wolfgang Aigner)和西尔维亚·米奇(Silvia Miksch)合著的《时间数据的可视化》( Visualization of Time Oriented Data )一书是一部经典之作。书中他们表现出的处理复杂情况的高超技巧、完善周到的分析处理、合理紧凑的写作风格以及清晰明确的插图,都给我留下了深刻的印象。

本书为学生、教师和所有致力于开发有效的交互式可视化数据分析系统的研究人员提供了明确的指导、全面的介绍和诸多灵感。我希望这本书能够激励读者投身这个领域。

——雅克·J.范·维克(Jarke J.Van Wijk)
荷兰埃因霍温理工大学科技学院,数学和计算机科学系 aA8KZx9kYCTi1SeBTYu9h0inaboCfpCf2oG6cZiLlNGwJdfGKsn3DvzcjQ8DYIEo

点击中间区域
呼出菜单
上一章
目录
下一章
×