能够实时查看数据的变化,是一个巨大的竞争优势。
——希拉里·梅森,快进实验室创始人兼首席执行官
随着时间的推移,业务环境中持续不断地产生大量数据,这使得这些数据被视为无边界的。客户、雇主和机器在昨天和今天都在生成数据,而且明天将持续不断地产生更多的数据。由于业务不会停歇,因此这个过程将永远持续下去,从任何有意义的角度来看,数据集总是不完整的。
在参与Confluent的《数据流业务影响:2022年动态数据状态报告》( Business Impact of Data Streaming: State of Data in Motion Report 2022 ,参见 https://oreil.ly/pGIMb )的企业中,有97%的企业能够访问实时数据流,但只有66%的企业能够全面利用这些实时数据流。
如今,许多企业正积极采用流数据和实时分析,以做出更为迅速、可靠和准确的决策,从而让企业能够在细分市场中取得竞争优势。
本章将介绍流数据和实时分析。在阐述为何组织应该对流数据进行数据分析之前,我们将首先深入了解一下流数据。在涵盖一些用例后,我们将概述可以构建的实时分析应用程序的类型。