本部分我们将介绍大数据可视化技术的基础知识,包括大数据开发环境的搭建、常见的大数据可视化工具、Python可视化编程基础以及Python中几个重要的可视化分析库。
由于本书后续的可视化分析是基于Hadoop集群讲解的,因此我们首先需要搭建集群,然后简单介绍集群的一些基础知识和案例数据集,以及几种连接Hadoop Hive的图形界面工具,并且通过实际案例介绍Tableau、Zeppelin和Python三类大数据常用的可视化工具。此外,还将讲解Python的一些基础知识,包括软件的安装、代码开发环境、如何访问常见的数据源以及Python中几类比较重要的可视化库。