购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言
大数据时代,Python数据分析与可视化之利器

为什么写这本书?

时至今日,大数据已经进入了千家万户。新闻推送、广告植入、教育培训……无一不是应用了大数据的结果,就连垃圾分类也应用了大数据技术进行分析和跟踪。面对铺天盖地的大数据,怎样才能快速发现其中的趋势、找到数据走势,从而改变工作模式,这是摆在数据工作者面前的难题。数据可视化借助图形化手段,能够清晰有效地传达与交流信息,并提供一种快速有效的发现数据特点的直观方式。Python语言天生具有处理数据和绘制图形的优势,当仁不让地成为数据可视化的最佳编程语言。

作为一种脚本语言,Python已经存在很长时间了,但最近几年突然成为热点。究其原因,是人们发现Python在处理大数据、数据可视化、操作云计算、维护虚拟化等方面具有得天独厚的优势。

(1)Python有庞大的库和组件,可以快速处理大量数据、绘制可视化图形、操作数据库、进行网络编程、开发桌面和Web应用、实现人工智能等。

(2)Python是一种面向对象的现代语言,有其他编程语言基础的人很容易学习和上手。

(3)Python是免费和开源的。

可以说,掌握了Python语言,就达到了“一览众山小”的境界。

同时,Python语言的NumPy、SciPy库能够非常快速和方便地操作大量数据、进行科学计算,Matplotlib库能够以简洁的代码绘制出漂亮的图形,灵活、准确地运用好Python的各种库和组件,就能够实现数据可视化的目的。为此,本书从Python语言基础出发,带领读者重点学习如何使用Python语言采集数据、存储数据、清理和分析数据,以及将数据绘制成2D、3D图形等相关知识,以简单明了的方式让读者尽快了解如何使用Python进行数据分析和可视化。

这本书有什么特点?

本书力求简单实用、深入浅出、快速上手。全书内容分为3篇12章,从Python环境搭建和语言基础,到数据清理、分析和绘制可视化图形,以及最后的完整案例,覆盖了Python数据分析与可视化开发的整个生命周期。从整体上来看,本书有以下特点。

(1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果。(2)专注于Python数据分析与可视化操作中实际用到的技术。相比大而全的书籍资料,本书能让读者尽快上手,开始项目开发。

(3)书中的“新手问答”和“小试牛刀”栏目能让读者尽快巩固知识,举一反三,学以致用。

本书既适合Python新手入门,一步步学懂弄通书中的每个知识点,快速掌握Python常用功能;也适合Python老手回顾所学、查漏补缺,提升自己在数据采集、数据分析与处理、图形绘制与数据可视化等方面的能力。

这本书里写了些什么?

本书内容分为3篇共12章,具体结构如下。

内容讲解介绍如下。

第1篇:基础篇,包括第1~4章。主要介绍了Python语言的基本情况与现状、环境搭建与软件安装,以及Python语言的基本知识。

第2篇:应用篇,包括第5~11章。主要介绍了Python的数据存取方法、数据清洗和预处理、大数据可视化分析基础,以及2D、3D等图形的绘制与可视化分析的方法及相关应用。

第3篇:实战篇,包括第12章。以抓取中国天气网相关数据存入MySQL数据库,并绘制相应图形为主线,综合本书各章知识点,介绍了数据采集、清理、保存及绘制可视化图形的基本步骤和方法。

通过这本书能学到什么?

通过本书能学到以下知识和技能。

(1)了解Python基本概念和背景、语言特点、发展历史等背景知识,掌握Python的安装与配置,了解常见Python开发工具并掌握其中一款。

(2)掌握Python语言的基本语法,了解Python读写文件和操作MySQL数据库的方法。了解网络爬虫的基本知识、原理,熟悉Beautiful Soup库的简单用法。

(3)了解数据清洗和预处理的概念和原则,掌握脏数据的清洗方法,掌握使用Pandas库预处理数据的基本方法和步骤。

(4)了解大数据的特征和发展趋势,掌握分析大数据的六个主要环节(阶段)及各个环节(阶段)的特点,掌握如何使用NumPy处理多维数组数据,掌握如何使用SciPy完成高级数学计算。

(5)掌握使用Matplotlib绘制各种常见可视化图形的方法,掌握使用Mplot3绘制3D柱状图、3D直方图和3D曲面图的方法;掌握使用Matplotlib制作简单的动画图形的方法;掌握使用PIL批量处理图片文件、生成CAPTCHA图像的方法;掌握对可视化图形的美化和修饰方法。

除了书,您还能得到什么?

(1)赠送:案例源码。提供与书中案例相关的源码,方便读者学习参考。

(2)赠送:Python常见面试题精选(50道),旨在帮助读者在工作面试时提升过关率。习题见附录,具体答案参见下方的资源下载。

(3)赠送:《微信高手技巧随身查》《QQ高手技巧随身查》《手机办公10招就够》三本电子书,教会读者移动办公的诀窍。“5分钟学会番茄工作法”视频教程,教会读者在职场之中高效地工作、轻松应对职场那些事儿,真正让读者“不加班,只加薪”!“10招精通超级时间整理术”视频教程,专家传授10招时间整理术,教会读者如何整理时间、有效利用时间。

温馨提示:以上资源,请用微信扫一扫下方任意二维码关注公众号,输入代码H2020435,获取下载地址及密码。

本书由凤凰高新教育策划,由高博、刘冰、李力三位老师合作创作。在本书的编写过程中,我们竭尽所能地为您呈现最好、最全的实用内容,但仍难免有疏漏和不妥之处,敬请广大读者不吝指正。

读者信箱:2751801073@qq.com

读者交流QQ群:725510346

作者简介

高博,高级工程师,IT杂家。主要研究方向为云计算与大数据、数据可视化等,熟悉.Net、PHP、Python, DevOps, MySQL、SQLServer等技术或工具。作为第一作者编写了《Discuz!社区管理员实用教程》《代码的力量—Discuz!源码分析与插件开发实例进阶》《PHP+MySQL+AJAX Web开发给力起飞》,参与编写了《Web 2.0社区网站实用宝典》《ASP.NET 4.0 MVC敏捷开发给力起飞》《Java Web应用开发给力起飞》等书籍。主持省部级纵向课题3项,参与纵向、横向课题16项,获得软件著作权12项。

刘冰,博士研究生,重庆邮电大学理学院教师,先后翻译出版程序设计、图像处理、计算机视觉等领域译著4部,编写教材5部,获发明专利2项,发表SCI/EI论文4篇,参与国家级、省部级项目3项。荣获重庆邮电大学优秀班主任、优秀班导师、优秀青年教师等荣誉称号。

李力,毕业于西安交通大学计算机学院,现工作于教育考试招生战线,曾长期在国防军工单位从事网络战、信息战研究,擅长需求分析与设计,作为第一作者编写了《Delphi从入门到精通》《VC++实战案例》等书籍,参与纵、横向课题12项,获得软件著作权4项。 v+nrpfTUugg4aYkYpoSVlPDAzYgd3udcSCRCI8WbsnRPEVXrL9hZl4vtcoP452zh

点击中间区域
呼出菜单
上一章
目录
下一章
×