本章对Spark相关概念和内部结构体系进行了介绍,并与Hadoop进行了对比。其中涉及Spark生态系统、Spark运行架构和部署模式。
同时也对Spark中的RDD的基本操作进行了简要说明,阐述了SQL语句在Spark当中的支持,最后介绍了Spark机器学习相关的知识。 DD8ZSgrNSD+75ibPonAaKzzSEKMzis2mh5W2wzajb6eUyFC8OncVbZ+N04netiFQ