本章首先讨论了Spark系统的安装部署、系统架构,以及其中涉及的重要概念。然后,我们通过Spark应用例子概览了Spark运行应用的整个过程。最后,我们讨论了Spark的编程模型。接下来,我们将在第3章中详细讨论Spark是如何根据用户代码生成逻辑处理流程的,在第4章中详细讨论Spark是如何根据逻辑处理流程生成物理执行计划的,其他章节将讨论Shuffle机制的具体实现、更复杂的应用,以及缓存与checkpoint机制等。 Bru+KMi2VyNGwVVN8G+ZWvVOUZu/f86pp2nNsKkmjtKUExGZSHiVZIPHGMux2yOt