购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

Preface
前言

为什么要写这本书

我在培训行业耕耘了10多年,作为专门培训数据分析技术的老师,我多年来一直很关注数据方面的相关书籍,可以说市面上绝大多数与数据分析相关的书我都看过,但发现现在市面上从编程“菜鸟”视角出发讲解Python数据分析的书比较少。

通过这么多年从事数据业务的培训和咨询,我对“菜鸟”读者的实际需求有了深入的了解,对他们的学习心态、知识储备、难点和痛点都心中有数。比如,不少刚刚上手Python编程的开发人员很关心Python的脚本是如何编译成.exe可执行文件的,虽然他们自己可以通过相关软件完成编译执行,但是他们的客户多数不会安装编译软件及搭建编程环境。再比如,“菜鸟”读者往往容易对枯燥的程序调试过程感到厌烦和恐惧,但是程序调试在编程中的重要性不言而喻。在刚刚上手写Python脚本的时候,开发人员往往遇到程序错误就不知所措,而合理使用程序调试则可以帮他们更快地找到问题。程序调试不仅对诊断程序错误的作用巨大,在帮助开发人员阅读Python脚本方面的作用也很明显。对于编程“菜鸟”来说,Python的对象以及对象中的属性和方法,都是比较晦涩难懂的,如果他们能熟练掌握程序调试技巧,大部分的Python脚本都会变得更加简单易懂。

针对以上需求,我撰写了本书。简而言之,这是一本专门写给编程“菜鸟”的Python数据分析书,无论是结构编排、内容组织还是语言风格,都针对这部分读者的实际需求来安排。

读者对象

本书的读者对象如下。

❑Python数据分析应用的初学者。这部分读者通过本书可以快速掌握Python数据分析的各项基础技能,从而有效应对Python数据分析的实际工作。

❑Python编程的初学者和爱好者。这部分读者通过本书不仅可以掌握Python的基础知识,实现Python编程入门,还可以结合Python在数据分析领域的应用案例,提高Python编程实践水平。

❑Python数据分析的培训老师和学员。本书脱胎于作者的一线培训经验,适合广大培训机构的老师和学员使用。

❑Python编程的中级开发者。这部分读者可以通过本书进一步丰富Python编程经验,掌握Python编程的实际应用。

❑大学应届毕业生。这部分读者可以通过本书入门Python,获得贴近真实工作场景的实践,增强面试优势。

本书的编排特色

本书的编排特色如下。

❑本书针对编程“菜鸟”的学习特点进行章节设计。例如,第2章详细介绍了Python的工作环境、Python的两种解释器以及如何编译成.exe可执行文件,第3章详细介绍了Python的编程基础知识,第4章深度剖析了程序调试(debug)。我深知如果编程“菜鸟”没有掌握这些内容,很难上手写Python脚本。

❑本书尽可能多地介绍Python在实际工作中的应用场景。例如,在数据结构部分,我特别强调字典这一数据结构在大数据分析和去重统计中的应用,同时强调集合这一数据结构在数据比对(差集)中的应用。本书通过实际应用场景介绍Python功能的例子还有很多,这种撰写方法能够较好地将Python的功能点和实际应用场景相结合,便于读者尤其是编程初学者快速掌握本书的内容。

❑本书添加了大量可实操的数据分析方法与模型。例如,第10~14章介绍了各种不同的重要而经典的数据分析模型;即使是总览数据分析方法的第9章也保证了所介绍的定量型数据分析方法是可实操的。

❑第15章提供了多个爬虫爬取数据的实例,更能满足Python编程“菜鸟”的需求。

另外,为了降低读者的学习门槛和成本,本书尽量压缩了文字的篇幅,不讲无用的理论,只讲能够帮助读者实践的干货知识。同时,本书提供了大量可以直接使用的代码以及直观的图表,以帮助读者更轻松地掌握所学知识。

如何阅读本书

本书分为两篇,主要内容如下。

Python基础篇(第1~7章):主要介绍了Python的工作环境、编程基础、Excel数据文件的操作、pandas数据包的应用等。对于Python初学者,这部分内容是必学的。学完这部分内容,读者不仅可以快速掌握Python编程基础,还能快速入门数据分析操作,从而应对大部分初级的Python数据分析类工作。

Python数据分析高级篇(第8~15章):着重介绍了Python在诸多数据分析模型中的应用,包括数据预处理、相关与回归、分类、决策树、关联分析、降维等重要且经典的数据模型,还介绍了爬虫的诸多实践案例。有一定Python数据分析应用经验的读者,可以直接从这部分开始阅读。通过学习这部分内容,读者可以快速掌握Python数据分析的各种高级技法,从而成长为中高级数据分析人员。

勘误和支持

由于作者的水平有限,编写时间仓促,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。如果读者有更多的宝贵意见,欢迎发送邮件至邮箱2050376450@qq.com,期待得到读者的真挚反馈。

本书配套资源可以从作者的微信公众号“Excel及数据分析”(微信号:data_analysis72)上下载。进入公众号后,在对话框中输入数字“18018”即可以得到相应源文件的下载链接。

致谢

首先,感谢阅读本书的读者,你们是我撰写本书的动力,也是激励我不断前行的动力。

其次,感谢在撰写本书过程中为我提供帮助的所有朋友。

最后,感谢我的家人,是家人承担起繁重而琐碎的家务,让我能专心投入到写作中,他们时时刻刻都给予我信心和力量! 9QFphYQBXRNVb33ECWXzht3PPblH8lMEINbt9On99Fn5iA1Lyk7E/J5/8QvEDu8S

点击中间区域
呼出菜单
上一章
目录
下一章
×