本章旨在让读者理解Spark SQL的产生和特点,以及与Spark SQL相关的数据容器。首先详细讲解什么是Spark SQL,以及Spark SQL的特点,然后介绍与Spark SQL相关的两种数据容器——DataFrame和DataSet,并阐述它们之间的关系以及差异。
本章主要知识点:
Spark SQL简介
Spark SQL的特点
DataFrame、DataSet介绍
Spark SQL与数据容器间的关系