购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言

随着大数据技术的不断发展和新数据的不断产生,大数据处理引擎也在不断升级。Spark作为继Hadoop之后的下一代大数据处理引擎,经过飞跃式发展,现已成为大数据产业中的一股中坚力量,越来越多的企业和组织开始使用Spark进行数据处理。而Spark SQL作为Spark生态系统中的一个重要组成部分,提供了SQL接口,使得数据分析人员可以更加便捷地进行数据查询和分析。在此背景下,市场上对于掌握Spark SQL数据分析技能的人才需求旺盛。

关于本书

本书内容基于Spark新版本展开,符合企业开发数据分析应用的需要。本书全面讲解Spark SQL相关知识和实战应用;内容包括Spark SQL概述、Spark概述和环境搭建、Spark典型数据结构RDD、Spark SQL入门实战(包括Scala编程基础)、Spark SQL语法基础及应用、Spark SQL数据源、Spark SQL性能调优等。最后通过影评数据分析、商品统计数据分析、咖啡销售数据分析等3个Spark SQL实战项目进行技能提升。

本书特点

(1)本书重视实践操作,涵盖框架搭建和开发环境安装、技术框架快速示例引入、技术框架详细案例讲解、大数据分析综合项目实战提升等内容,并将实战开发与理论知识相结合,从而促进读者深入掌握大数据分析技能。

(2)作者是具有多年大数据分析和处理实战经验的高级工程师,在写作本书时,结合自己的技术功底并融入实战心得,使得所介绍的内容逻辑清晰、步骤详细、通俗易懂,方便读者自学。

(3)本书配套提供全部示例源码、数据集、PPT课件和教学大纲,方便读者提高学习效率,保证学习质量。

配套资源下载与答疑服务

本书配套资源包括示例源码、数据集、PPT课件和教学大纲,读者需要用自己的微信扫描下面的二维码获取。如果阅读过程中发现问题或产生疑问,请使用下载资源中提供的相关电子邮箱或微信联系我们。

本书读者

●Spark初学者

●Spark大数据分析人员

●Spark大数据管理人员

●Spark大数据分析应用开发人员

●高等院校或高职高专院校Spark大数据课程的学生

编者
2024年8月 Sf4EqjQIGCRRjhTFcTR+i3i+ZI6Qr8bkFS/6M0A0Xtz3mSXSf1mFwNQBVi2meOHU

点击中间区域
呼出菜单
上一章
目录
下一章
×