购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言

技术革命的浪潮推动着人类文明的发展。

第一次浪潮造就了农业革命,它在数千年前出现并持续了数千年;第二次浪潮造就了工业革命,它在数百年前出现并持续了数百年;我们今天正在经历着信息技术第三次浪潮,发端于数十年前,目前也只是处在初级阶段。

农业技术革命释放了“物之力”;工业技术革命释放了“能之力”,而今天的信息技术革命释放的是“智之力”。

距今400年前,培根在《伟大的复兴》中预言:知识就是力量。今天,人类终于迎来“知识经济时代”,它是人类社会经济增长方式与经济发展的全新模式。

人类认识物质世界、人类社会和精神世界的最高境界是智慧,而要达智慧的境界,必然要跨越数据、信息、知识三个层级。

数据作为基础,是信息之母、知识之初、智慧之源。正是今天的大数据技术,引燃了人们实现智慧城市、智慧医疗、智慧教育等有关人工智慧的激情。人们真切地认识到,对于人工智能,只要让数据发生质变,即使是简单的数据,也比复杂的算法更有效。

今天,移动互联网的发展,使我们在获取数据上有了质的飞跃,人类的各种社会活动都与互联网这个虚拟世界相联系,使全样本、全过程地有效测量和记录成为可能,构建了生成大数据生态的土壤,同时,人们还在期待和憧憬物联网带来更大的冲击。

另一方面,云计算发展到今天,不论从技术到产业都开始进入成熟期,这也是大数据发展的基石和推进器。

在今天这个时代中,运用大数据洞见事物蕴藏的“智慧”成为人们的渴望。大数据更新了人们对数据的认识。在技术层面,小数据时代的很多数据处理方法和工具已不再有效,需要一系列新的方法和工具。所幸,有大量平民化的开源软件可用,它们不需要特殊的硬件系统,也更适用于云计算环境。

本书正是一本介绍主流的大数据开源软件平台和工具的技术专著,侧重于大数据的实践性技术,帮助读者快速入门,通过具体深入的实践,体会大数据的技术本质特征,领略大数据技术带来的创新理念,更好地理解和把握信息技术的发展趋势。

本书定位

(1)信息发展已步入大数据时代,当前对于大数据还缺乏面向公众的技术实践手册。

(2)本书的创作团队有丰富的大数据规划、开发、运营等经验,多位作者成功地架构了教育部、科技部、互联网等大数据架构与分析项目。

(3)本书的参与者均是部委信息一线工程师、著名外企架构师、国内企业资深高级工程师,所做的理论分析易于学习,实践具有可操作性。

(4)本书重点介绍大数据的基础理论、关键技术,以及编程实践。利用本书,就可以完全搭建并能有效地管理好大数据平台。

本书特色

(1)理念先进:均是国内外最新的大数据理念;方便读者全面了解国内外大数据研究与发展的情况。

(2)技术领先:参与者均是国内IT人士;采用的平台均是业界主流开源平台,涉及大数据常用的HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka等技术的介绍与编程使用。

(3)案例丰富:提供翔实的实例与解决方法,供项目中参考。

(4)资源齐备:本书涉及的配套下载资源可以从清华大学出版社的网站中下载。

全书关键字

大数据、分布式计算、数据仓库、数据分析、HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka。

由于编者的水平有限,书中难免有疏漏和错误,希望业内专家和广大读者指正。

编者 O1E+H5skmB2E7IOc+qXSFl0VAc9RRhXI2e9f8Vb9xMgvsNmsURQpnDbFDA4xZR1N

点击中间区域
呼出菜单
上一章
目录
下一章
×