“让每个人都成为数据分析师”是大数据时代的要求,数据可视化技术的出现恰恰从侧面缓解了专业数据分析人才的缺乏。Tableau、Microsoft、IBM等IT厂商纷纷加入数据可视化的阵营,在降低数据分析门槛的同时,为分析结果提供了更炫的展现效果。
但是,这些可视化工具存在不足之处,其中比较大的缺点是视图定制化水平有限,不能根据分析师的想法进行个性化定制。Python中的部分包恰好弥补了这个不足。Python是开源免费、简单易学、用途广泛的编程语言。本书将围绕如何使用Python对大数据进行可视化这一话题展开,希望能对正在选型中的个人和企业有所帮助。
研究表明人类大脑处理图形的速度要比文字快几万倍,如何将海量的数据转换成可视化的图形是数据分析的必修课。Matplotlib和Pyecharts是Python中常用的两个可视化库,其功能强大,可以方便地绘制折线图、条形图、柱形图、散点图等基础图形,还可以绘制复杂的图形,如日历图、树形图、聚类图等。
Matplotlib是Python数据可视化库的泰斗,尽管已有十多年的历史,但仍然是Python社区中使用广泛的绘图库,它的设计与Matlab非常相似,提供了一整套和Matlab相似的命令API,适合交互式制图,还可以将它作为绘图控件,嵌入其他应用程序中。
Pyecharts是一款将Python与Echarts相结合的数据可视化工具,可以高度灵活地配置,轻松搭配出精美的视图。其中,Echarts是百度开源的一个数据可视化库,而Pyecharts将Echarts与Python进行有机对接,方便在Python中直接生成各种美观的图形。
本书首先介绍大数据可视化分析的一些基础知识和主要技术,然后通过实际案例重点讲解Matplotlib和Pyecharts在数据可视化分析过程中的技巧及方法,包括图形参数设置、绘制基本图形、绘制高级图形等。希望本书的出版能够改变目前国内市场相关图书匮乏,而且书中案例较少的现状。
本书由浅入深、循序渐进地介绍Python可视化技术,并且结合案例重点介绍Python在数据可视化方面的应用和使用技巧。全书以案例为主线,既介绍软件应用与操作的方法和技巧,又融入了可视化的基础知识,使读者通过学习本书能够轻松掌握可视化的方法。下载资源中包含每个案例采用的数据源文件,供读者在阅读本书时进行操作练习。
本书可作为管理、经济、社会人文等相关从业人员学习Python软件进行大数据可视化分析的参考书,也可以作为高校计算机相关专业本科生、研究生的教材或教学参考书。
截至2019年11月,Matplotlib的版本为3.1.1,Pyecharts的版本为1.5.1。本书正是基于以上版本编写的,全面且详细地介绍它们在数据可视化分析中的应用。
第1章介绍大数据可视化的技术挑战、技术难点以及可视化工具的必备特性。
第2章介绍Hadoop集群的安装及配置、集群案例数据集以及连接集群的工具。
第3章介绍大数据可视化软件Tableau、Zeppelin和Python及其可视化案例。
第4章介绍Python环境的安装、如何搭建代码开发环境以及如何连接各类数据源。
第5章介绍Python主要的数据可视化库,如Matplotlib、Pyecharts、Seaborn等。
第6章介绍Matplotlib的图形参数设置,如线条、坐标轴、图例等。
第7章介绍使用Matplotlib绘制基础图形,如直方图、饼图、散点图等。
第8章介绍使用Matplotlib绘制高级图形,如树形图、误差条形图等。
第9章介绍Pyecharts的图形参数配置,如全局配置项和系列配置项。
第10章介绍使用Pyecharts绘制常用视图,如折线图、条形图、箱形图等。
第11章介绍使用Pyecharts绘制高级视图,如日历图、仪表盘、环形图等。
第12章通过实际案例介绍Pyecharts与Django的集成,包括Django框架等。
(1)精心构建的学习体系
本书为读者构建了一个科学合理、循序渐进的学习体系,首先介绍如何构建Hadoop集群,并导入企业数据案例集,以方便后续的上机演练;然后介绍如何运用Matplotlib和Pyecharts可视化工具实现数据可视化;最后介绍如何在Web上展示自己的数据。代码注释详细,解说步骤清晰,十分易于上手。
(2)学以致用,马上提升职场竞争力
全书以某上市电商企业的客户数据、订单数据、股价数据为基础进行讲解,所有案例基本上都围绕该企业的数据可视化展开,如销售额的分析、商品收益率的分析、利润额的分析、客户教育水平的分析、企业股价变动分析等,有的放矢,掌握专业技能,并应对工作需求。
(3)以案例为主线,提供丰富的配书资源
全书以案例为主线,既包括软件的操作方法与应用技巧,又融入了数据可视化的基础知识。为了方便读者使用本书,还提供了源代码、PPT课件和教学视频,读者扫描本书提供的二维码即可下载,可随时随地观看,大幅提升学习效率。
为了方便读者更好地使用本书,本书还免费提供了以下资源:
源文件与程序代码:读者扫描右侧的二维码下载后直接调用即可上机演练。
PPT教学课件:方便培训或教学使用,同样,读者可扫描右侧的二维码下载。
教学视频:读者扫描本书各章提供的二维码即可在移动设备上观看,随时随地学习,充分利用碎片时间。
如果下载有问题或需要技术支持,请联系booksaga@126.com,邮件主题为“Python数据可视化之Matplotlib与Pyecharts”。
本书的内容和案例适用于互联网、电商、咨询等行业数据分析用户以及媒体、网站等数据可视化用户,可供高等院校相关专业的学生以及从事大数据可视化的研究者参考使用,也可作为Python软件培训和自学的教材。
由于编者水平有限,书中难免存在错误和不妥之处,请广大读者批评指正。
编 者
2020年1月