书籍目录
首页
分类
免费
排行
我的书架
1-50章
51-85章
共85章
免费
版权信息
免费
摘要
免费
前言
免费
第1章 Spark编程模型
免费
1.1 Spark:一体化、多元化的高速大数据通用计算平台和库
免费
1.2 Spark大数据处理框架
免费
1.3 Spark子框架解析
免费
第2章 构建Spark分布式集群
免费
2.1 搭建Hadoop单机版本和伪分布式开发环境
免费
2.2 搭建 Hadoop分布式集群
免费
2.3 Spark集群的动手搭建
免费
2.4 构建Hadoop单机版本和伪分布式环境
免费
第3章 Spark开发环境及其测试
免费
3.1 搭建和设置IDEA开发环境
免费
3.2 测试IDEA环境
免费
3.3 实战:在IDEA中开发代码,并运行在Spark集群中
免费
第4章 Spark RDD与编程API实战
免费
4.1 深度解析Spark RDD
免费
4.2 Transformation Operations动手实战
免费
4.3 Action Operations动手实战
免费
4.4 Spark API综合实战
第5章 Spark运行模式深入解析
5.1 Spark运行模式概述
5.2 Standalone模式
5.3 Yarn-Cluster模式
5.4 Yarn-Client模式
第6章 Spark内核解析
6.1 Spark内核初探
6.2 Spark内核核心源码解读
6.3 以RDD的count操作为例触发Job全生命周期源码研究
6.4 Akka驱动下的Driver、Master、Worker
第7章 GraphX大规模图计算与图挖掘实战
7.1 Spark GraphX概览
7.2 Spark GraphX设计实现的核心原理
7.3 Table operator和Graph Operator
7.4 Vertices、edges、triplets
7.5 以最原始的方式构建graph
7.6 动手编写第一个Graph代码实例并进行Vertices、edges、triplets操作
7.7 在Spark集群上使用文件中的数据加载成为graph并进行操作
7.8 在Spark集群上掌握比较重要的图操作
7.9 Spark GraphX图算法
7.10 淘宝对Spark GraphX的大规模使用
第8章 Spark SQL原理与实战
8.1 为什么使用Spark SQL
8.2 Spark SQL运行架构
8.3 解析Spark SQL组件
8.4 深入了解Spark SQL运行的计划
8.5 搭建测试环境
8.6 Spark SQL之基础应用
8.7 ThriftServer和CLI
×