本书共8章,内容主要包括Spark概述及入门实战,Spark的作业调度和资源分配算法,Spark SQL、DataFrame、Dataset的原理和实战,深入理解Spark数据源,流式计算的原理和实战,亿级数据处理平台Spark性能调优,Spark机器学习库,Spark 3.0的新特性和数据湖等。
本书适合Spark开发人员和Spark运维人员阅读。 M16WQzNG73MgQVIy44GpewQALBZtUUS3aeP64WQsZEQs+FIZetpRv04qsOrEdpL3