统计学是一门涉及计算机、数据库等多个专业的学科,要想成为优秀的数据分析师,不仅需要精通业务知识,还需要深厚的数学知识和广博的案例经验。本书全面地介绍了常见的统计学分析方法,包括描述性统计分析、参数估计、非参数估计、相关分析和回归分析等,并结合实际案例详细讲解了它们的应用场景与优缺点。
本书具有十分突出的实用性和普适性,是带领读者走近统计学的绝佳敲门砖,为读者后续的职业发展打下良好基础。通过阅读本书,读者可快速了解统计学这一行业的全貌,掌握统计学基础知识,并运用到实际工作中。
因作者水平有限,书中难免存有疏漏和不当之处,敬请读者批评指正。
1. 案例丰富全面,贴近生活,适合各行各业的读者
本书共有近30个案例,涉及零售业、电商业、餐饮业、金融业、服务业和博彩业等多个行业,有平易近人、随处可见的案例,也有难得一见、使用高新技术的案例;有规模宏大、涉及多方资源的案例,也有见微知著、仅需少量数据的案例;有成功的案例,也有失败的案例。多行业、多层次、多角度的案例分析增强了本书的可读性,读者可了解到统计学是如何在各个行业中发挥作用的。
2. 内容深入浅出,层层递进
本书从最简单的描述性统计分析入手,由易到难,依次讲解了统计图表绘制、概率分布等基础知识,以及参数估计、方差分析、相关分析和回归分析等分析方法。结合具体案例,读者将对这些理论知识有更深入的理解。读者既可按照顺序依次阅读,又可在读完理论部分后,立即阅读相关案例。
3. 语言简明扼要,脉络清晰,构建出完整知识体系
统计学的各个分析方法之间存在递进关系,如方差分析是在假设检验的基础上发展得来的,而假设检验又是对参数估计的拓展与延伸。除传统统计学分析方法外,还有机器学习方法等。本书按照各个知识点的关系合理地组织了结构,各个章节间彼此关联,构建出一个完整的统计学知识体系,以帮助读者对统计学有一个全面的认识。
本书共有8章,每一章都有一个独立的主题。全书还可分为两部分。
第一部分为第1~3章,内容为理论知识。其中第1章介绍了统计学科的起源,以及几个有趣的统计问题;第2章介绍了描述统计基础,包括数据的类型、常用统计量、数据预处理和绘制统计图表等;第3章的主题是推断统计基础,是较为重要的一章,介绍了常见的概率分布、相关分析与回归分析基础等内容。
第二部分为第4~8章,介绍了若干真实案例,每一章围绕一个主题展开,并涉及5个或6个具体案例。其中第4章为描述性统计分析,第5章为相关分析与回归分析,第6章为关联分析与聚类分析,第7章为决策树与模式识别,第8章为更多的数据挖掘算法。
案例部分又可进一步加以区分,其中第4章和第5章所介绍的方法是传统统计方法,其理论知识在第1~3章中有详细阐述;第6~8章所介绍的方法则是机器学习方法,其理论知识在案例中展开叙述。
· 数据分析从业人员
· 金融行业从业人员
· 统计学专业的学生
· 数据科学程序员
· 对统计学感兴趣的各类人员