购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
云上的大数据架构

大数据可能意味着更多的信息,但也意味着更多的虚假信息。

——Naseem Taleb

正如我们在第1章了解到的,关于云数据湖有两个关键要点,它们为本章奠定了基础:

· 数据湖方法始于存储和处理任何类型的数据的能力,无论其来源、大小或结构如何,从而允许组织从具有可变值密度(即信噪比)的许多不同的数据源中提取高价值见解。

· 在云上构建数据湖涉及一个分解式架构,你可以将IaaS、PaaS和SaaS解决方案的不同组件组合在一起。

重要的是要记住,构建云数据湖解决方案还为你提供了许多架构选项,每种选项都有自己的优势。Future.com上的这篇文章( https://oreil.ly/VUHSK )全面概述了现代数据架构的各个组件。在本章中,我们将以一个名为Klodars的虚构公司(组织)为例,深入探讨一些更常见的架构模式,了解它们并理解每种架构的优点。 uiRLSW7wYYQa/sIk1DcEnTNetef246vuBq2+2LOdbrkMSV+uCgujHr3Kr6L4ewae

点击中间区域
呼出菜单
上一章
目录
下一章
×