本书将系统介绍Hadoop、Spark两种大数据处理框架,全书共12章,内容包括Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Spark RDD编程、Windows环境下Spark综合编程、Spark SQL结构化数据处理、Spark Streaming流计算、Spark GraphX图计算以及《平凡的世界》中部分人物关系图分析的项目实训。
本书可作为高等院校计算机、信息管理、软件工程、大数据、人工智能等相关专业的大数据课程的教材,也可供从事大数据开发的工程师和科技工作者参考。