在日常数据分析过程中,Excel、Python、R、SQL、Power BI、Tableau等都是数据分析师常用的工具。
在这几款工具中,Excel因其灵活、高效及易获取性,不管是早期推出的函数与VBA,还是近几年所推出的Power BI(内置了Power Query、Power Pivot等)都让其拥有数量庞大的用户群,从而成为众多数据分析师的首选。在近几年的计算机语言流行排行榜中,Python是当前最热门的语言之一,并且热度一直有增无减。
“人生苦短,我用Python”。其实,在数据分析中Excel与Python是可以完美结合的,并且越来越多的数据分析师已倾向于从Excel过渡到Python。通过xlwings或openpyxl替换VBA,通过Pandas替换Excel数据分析,通过NumPy+Pandas与xlwings/openpyxl等的交互,用最简洁的代码操作更大量的数据,从而实现更高阶的数据分析与报表自动化。
本书采用理论与实践相结合的原则,在各章的开篇采用图解方式,将所有知识点先贯穿起来,然后对每个知识点的配套案例进行讲解。在讲解的过程中重思路、重基础、重实操,“用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效地掌握最实用的技能”是本书创作的初衷。在Pandas、xlwings、openpyxl的高阶应用过程中,书中演示了大量的对比方案,例如,同一批量操作Pandas、xlwings、openpyxl三者间不同的应用方法。
“用一个数据源讲解一本书”及“注重图解”是本书的写作风格,书中穿插大量的知识图解与引导。从入门篇到高阶篇的近300个应用案例中,主要围绕着一个简单的工作簿(订单表.xlsx)及其子集(华东.xlsx)为数据源进行有效讲解,把Pandas中使用频率最高的或效率最高的80%的函数、方法、属性及其与xlwings、openpyxl的对比与交互应用,以及与Matplotlib、Seaborn的交互应用,通过对比与扩展两种方式加深读者对知识的全面了解与应用。最后通过一个实用的案例,把全书的所有重要知识点一一串接起来,并最终轻松转换为实战案例。
本书前半部分为Excel+Python的数据分析基础,后半部分为Excel+Python的数据分析与自动化进阶。本书适用于具有数据分析或Python基础的读者,包括电商客服、质量统计、财务金融、人事行政等与数据分析密切相关的从业人员,也可作为高等院校、IT培训机构的教材,还可作为IT专业人士的自学参考书。
扫描下方付费二维码可下载本书源码。
首先要感谢笔者的妻子,写作过程中占据了大量的个人时间及家庭时间,她的理解与支持是笔者最大的动力。
感谢笔者的父母,是你们的谆谆教诲才使笔者一步一个脚印地走到今天。
还要感谢清华大学出版社赵佳霓编辑,她一如既往的专业指导让笔者受益匪浅。
由于时间仓促,书稿虽然经过全面检查,但疏漏之处在所难免,敬请读者批评指正,你们的反馈是笔者进步的动力。
黄福星
2023年4月19日
说明:文中需扫码阅读的请扫此付费二维码。