本章主要介绍Spark是如何将应用程序转化为逻辑处理流程的,包括RDD数据模型概念、数据操作概念,以及数据依赖关系的建立规则等。本章还将详细介绍常用的数据操作,不仅给出相关的示例代码,还会详细给出其逻辑处理流程图、探讨相关的性能问题,为下一章讨论物理执行计划做准备。 KdxB2cynFvNHp51u9e9sn8G2hA2FJ+I/3yfmNUbsg0eHNl59aNUh8vJC7ubQWZdj