购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.6 学前导读

1.6.1 学习的基础要求

本书面向的主要读者是具有基本的编程基础、对大数据行业感兴趣的互联网从业人员,以及想要进一步了解数据仓库的理论知识和搭建流程的大数据行业从业人员。无论读者是想初步了解大数据行业,还是想全面研究数据仓库的搭建流程,都可以从本书中找到自己想要的内容。

在跟随本书进行数据仓库的学习之前,如果读者希望实现对数据仓库的搭建,那么可以提前了解一些基础知识,以便更快地了解本书的内容,在学习后续众多章节的内容时不会遇到太多困难。

首先,学习大数据技术,读者一定要掌握一个操作大数据技术的利器,这个利器就是一门编程语言,如Java、Scala、Python等。本书以Java为基础进行编写,因此学习本书的读者需要具备一定的Java基础知识和Java编程经验。

其次,读者还需要掌握一些数据库知识,如MySQL、Oracle等,并熟练使用SQL,本书将出现大量的SQL操作。

最后,读者还需要掌握一项操作系统技术,即Linux,只要能够熟练使用Linux的常用系统命令、文件操作命令和一些基本的Linux Shell编程即可。数据系统需要处理业务系统服务器产生的海量日志数据,这些数据通常存储在服务端,各大互联网公司常用的操作系统是在实际工作中安全性和稳定性较高的 Linux或UNIX。大数据生态圈的各框架组件也普遍运行在Linux上。

如果读者不具备上述基础知识,那么可以关注“尚硅谷教育”公众号获取学习资料,并根据自身需要选择相应的课程进行学习。同时,本书提供了与所讲解项目相关的视频课程资料,包括尚硅谷大数据的各种学习视频,读者在“尚硅谷教育”公众号回复“金融数仓”即可免费获取。

1.6.2 你将学到什么

本书将带领读者完成一个功能完善、数据流完整的金融租赁行业数据仓库项目,根据项目需求,搭建一套高可用、可伸缩的数据仓库项目架构,并对外展示结果数据。

本书的前三章是项目需求和框架讲解部分,对数据仓库的架构知识进行了重点讲解,并着重分析了数据仓库应满足的重要功能和需求。通过学习本部分内容,读者可以全面地了解一个数据仓库项目的具体需求,以及如何根据需求完成框架的选型。读者可以跟随本部分内容一步步搭建自己的虚拟机系统。为了完成本部分内容的学习,读者需要掌握必要的Linux系统操作常识。

后四章是项目框架搭建数据仓库核心部分,重点讲解了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程。在本部分内容中,读者将会了解一条数据在数据仓库中是如何流动、清洗、转换的,并将掌握DataX、Flume、Kafka等数据采集工具的工作原理及应用方法。本部分内容也将通过代码完成数据仓库项目的所有指标需求。

通过对数据仓库系统的学习,读者能够对数据仓库项目建立清晰、明确的概念,系统、全面地掌握各种数据仓库项目技术,轻松应对各种数据仓库的难题。 0NLlehEfRRKTqszuarZ/ey6Pb3kWeTlEdR8j3m2gvZxK427XgXZa8pLJ7YIg1TvM

点击中间区域
呼出菜单
上一章
目录
下一章
×