购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言

当今互联网已进入大数据时代,大数据技术已广泛应用于各行各业。不同领域每天都会产生海量数据,数据计量单位已从TB发展到ZB,未来数据量还将爆发式增长。谷歌、阿里巴巴、百度、京东等互联网公司都急需掌握大数据技术的人才,目前这类人才出现了供不应求的状况。

市面上大数据相关的图书不少,但以真实项目贯穿全书来介绍技术和提升应用能力的并不多。事实上大数据技术涉及的内容和工具非常多,学习曲线也并不顺滑,而且仅仅了解理论知识但没有经过项目开发的检验,也无法很好地掌握这些知识。如何事半功倍地学习和掌握大数据技术,这正是本书编写的初衷。本书以实现一个“企业级大数据用户搜索行为分析系统”项目为导向,内容涵盖当前主流的大数据开发框架Hadoop、ZooKeeper、Kafka、Hive、HBase、Spark等。

本书借助真实业务场景,详解项目实现过程,插入案例分析与动手练习,帮助读者提高动手能力。

本书内容

全书共6章,内容如下:

第1章讲解项目需求与架构设计,概览项目整体规划。

第2章讲解大数据项目开发之前对操作系统集群环境的配置,包括虚拟机的创建、CentOS 7操作系统的安装、Hadoop的安装等,手把手带领读者搭建项目所使用的大数据开发基础环境,为后续的项目实操打下坚实的基础。

第3~5章逐步实现项目需求。以项目为导向,讲解“用户行为数据采集模块”“用户行为数据离线分析模块”和“用户行为数据实时分析模块”的开发。

第6章讲解“数据可视化模块”的开发,并将所有模块整合到一起,测试数据的流转,最终完成了整个项目的开发与系统的搭建。

本书各章均采用手把手的教学方式,读者可以对照书中的步骤从0到1成功搭建属于自己的大数据分析系统。

本书特点

学习本书的建议

推荐按章节顺序阅读并上机实操,因为后续章节是建立在前面的基础上的,这种循序渐进的方式能让读者更加容易地掌握大数据开发技能,并完成项目开发。

首先阅读第1、2章,了解项目的主要功能、技术架构与集群规划,以对项目有整体认识,学习搭建开发环境。

然后依次学习第3~6章。学习每章前,先了解操作目的与该章内容在项目中的位置,然后实操搭建环境,编写应用程序,如此效果更佳。

按书中步骤实操,便可成功搭建本书的大数据项目。搭建成功后,读者还可以举一反三,加入一些创意功能,以令本书项目更完善、功能更强大。读者也可在网站与他人讨论,互帮互助。

本书适合的读者

本书配套资源

本书还提供了源码和教学课件,读者可以扫描下面的二维码,按照页面提示把下载链接转发到自己的邮箱进行下载。如果在阅读本书的过程中发现问题,请用电子邮件联系booksaga@126.com,邮件主题写“企业级大数据项目实战:用户搜索行为分析系统从0到1”。

读者如对书中知识有疑问,可通过微信公众号“奋斗在IT”联系作者,该公众号提供Java大数据学习教程与视频资源。

因时间与水平限制,书中难免存在疏漏,欢迎读者批评指正。

张伟洋
2023.3 PsPhV2Bzq7OzpMDCLK5xrsLHKDcpFLlXNYK7QgV6hHNVlguDHazrpjuIrs+Ep8Bw

点击中间区域
呼出菜单
上一章
目录
下一章
×