在任何企业中,数据存储都是一个关键且无法绕开的话题。企业产生的数据以什么样的形式进行存储以及应用从哪里读取数据并提供后续的服务都离不开存储的选型。不同的数据存储类型或者框架有不同的适用场景,所以技术选型是必须慎重考虑的环节,选择一个较为合适的存储框架可以避免很多问题。
此外,由于数据存储选型一旦确认,应用就会持续地产生数据并进行存储,随着时间的推移,存储的数据越来越多,如果存储选型与应用发展或者需求不匹配,那么数据存储切换带来的数据迁移成本不是每个企业都能够承担的。
在数字化时代,各式各样的数据存储框架层出不穷,例如以关系型数据库为代表的Oracle、MySQL、PostgreSQL等,以NoSQL为代表的HBase、Cassandra等,以列式存储为代表的ClickHouse等。在具体的场景中选择合适的框架是每个从业者都需要面对的挑战。
本章将从数据存储基础开始,结合数据存储发展的5个阶段—集中式数据存储阶段、分布式数据存储阶段、大数据存储阶段、特定领域存储阶段以及实时计算阶段,介绍市面上主流的数据存储框架架构,为从业者进行数据存储选型提供一些参考。
Tips 这里的数据存储并不只是指我们通常了解的磁盘之类的硬件,而是指在数据架构中数据存储所使用的软件或者系统,如各种关系型数据库或NoSQL等。