Python大数据处理库PySpark实战
Python大数据处理库PySpark实战
清华大学出版社 | 汪明
19.4万字
计算机

内容简介:本书正是一本PySpark入门教材,适合有一定Python基础的读者学习使用。本书分为7章,第1章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spark作为大数据处理的特点和算法;第3章介绍Spark实战环境的搭建,涉及Windows和Linux操作系统;第4章介绍如何灵活应用PySpark对数据进行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库进行分布式机器学习(Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时项目。

...

目录 51章查看目录

免费版权信息 免费内容简介 免费前言
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

精彩热评 1条更多

作者其他书籍

同类好书

加入书架
免费试读
全本购买
打开
×