书籍目录
首页
分类
免费
排行
我的书架
1-50章
51-51章
共51章
免费
版权信息
免费
内容简介
免费
前言
免费
第1章 大数据时代
免费
1.1 什么是大数据
免费
1.2 大数据下的分析工具
免费
1.3 小结
免费
第2章 大数据的瑞士军刀
免费
2.1 Hadoop与生态系统
免费
2.2 Spark与Hadoop
免费
2.3 Spark核心概念
免费
2.4 Spark基本操作
免费
2.5 SQL in Spark
免费
2.6 Spark与机器学习
免费
2.7 小结
免费
第3章 Spark实战环境设定
免费
3.1 建立Spark环境前提
免费
3.2 一分钟建立Spark环境
3.3 建立Hadoop集群
3.4 安装与配置Spark集群
3.5 安装与配置Hive
3.6 打造交互式Spark环境
3.7 小结
第4章 活用PySpark
4.1 Python语法复习
4.2 用PySpark建立第一个Spark RDD
4.3 RDD的操作与观察
4.4 共享变数
4.5 DataFrames与Spark SQL
4.6 撰写第一个Spark程序
4.7 提交你的Spark程序
4.8 小结
第5章 PySpark ETL实战
5.1 认识资料单元格式
5.2 观察资料
5.3 选择、筛选与聚合
5.4 存储数据
5.5 Spark存储数据到SQL Server
5.6 小结
第6章 PySpark分布式机器学习
6.1 认识数据格式
6.2 描述统计
6.3 资料清理与变形
6.4 认识Pipeline
6.5 逻辑回归原理与应用
6.6 决策树原理与应用
6.7 小结
第7章 实战:PySpark+Kafka实时项目
7.1 Kafka和Flask环境搭建
7.2 代码实现
×