本书共8章,内容主要包括Spark概述及入门实战,Spark的作业调度和资源分配算法,Spark SQL、DataFrame、Dataset的原理和实战,深入理解Spark数据源,流式计算的原理和实战,亿级数据处理平台Spark性能调优,Spark机器学习库,Spark 3.0的新特性和数据湖等。
本书适合Spark开发人员和Spark运维人员阅读。 ljgHV+0EHNFpDbSkePqP5mtEAK0Kf7J4V10BCWeYVftTt9mJsbiCv3+HTXyMu2ut