![]() |
书名:PySpark大数据分析与应用
主编:戴刚 张良均
副主编:桂友武 李晓英
出版社:人民邮电出版社
出版时间:2024-04-01
ISBN:9787115634900
本书由人民邮电出版社有限公司授权掌阅科技电子版制作与发行
版权所有·侵权必究
本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1~5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例强化PySpark在大数据分析中的实际应用;第6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark 的信用贷款风险分析两个完整的案例实战,结合前5章的PySpark编程知识,实现完整的大数据分析过程。本书大部分章包含实训和课后习题,读者通过练习和操作实践,能够巩固所学的内容。
本书可作为高校数据科学或大数据相关专业的教材,也可作为机器学习爱好者的自学用书。
专家委员会主任 :郝志峰(汕头大学)
专家委员会副主任 (按姓氏笔画排列) :
王其如(中山大学)
余明辉(广州番禺职业技术学院)
张良均(广东泰迪智能科技股份有限公司)
聂 哲(深圳职业技术大学)
曾 斌(人民邮电出版社有限公司)
蔡志杰(复旦大学)
专家委员会成员 (按姓氏笔画排列) :
王 丹(国防科技大学)
王爱红(贵州交通职业技术学校)
化存才(云南师范大学)
孔 原(江苏信息职业技术学院)
史小英(西安航空职业技术学院)
冯国灿(中山大学)
戎海武(佛山科学技术学院)
朱元国(南京理工大学)
任传贤(中山大学)
刘彦姝(湖南大众传媒职业技术学院)
孙云龙(西南财经大学)
花 强(河北大学)
李明革(长春职业技术学院)
王 津(成都航空职业技术学院)
韦才敏(汕头大学)
方海涛(中国科学院)
邓明华(北京大学)
冯伟贞(华南师范大学)
边馥萍(天津大学)
吕跃进(广西大学)
朱文明(深圳信息职业技术学院)
刘保东(山东大学)
刘深泉(华南理工大学)
阳永生(长沙民政职业技术学院)
杜 恒(河南工业职业技术学院)
杨 坦(华南师范大学)
杨 虎(重庆大学)
杨治辉(安徽财经大学)
吴孟达(国防科技大学)
邱炳城(广东理工学院)
沈 洋(大连职业技术学院)
宋汉珍(河北石油职业技术大学)
张 敏(广东泰迪智能科技股份有限公司)
张尚佳(广东泰迪智能科技股份有限公司)
张治斌(北京信息职业技术学院)
张雅珍(陕西工商职业学院)
武春岭(重庆电子工程职业学院)
赵 强(山东师范大学)
胡国胜(上海电子信息职业技术学院)
施 兴(广东泰迪智能科技股份有限公司)
秦宗槐(安徽商贸职业技术学院)
韩宝国(广东轻工职业技术学院)
蒙 飚(柳州职业技术学院)
谭 忠(厦门大学)
魏毅强(太原理工大学)
杨志坚(武汉大学)
肖 刚(韩山师范学院)
吴阔华(江西理工大学)
余爱民(广东科学技术职业学院)
沈凤池(浙江商业职业技术学院)
宋眉眉(天津理工大学)
张积林(福建工程学院)
陈 永(江苏海事职业技术学院)
林智章(厦门城市职业学院)
胡支军(贵州大学)
韩中庚(信息工程大学)
曾文权(广东科学技术职业学院)
谭 旭(深圳信息职业技术大学)
薛 毅(北京工业大学)