应邀为这本书写序,我不胜荣幸。纵观数据科技的发展历史,从数据仓库、数据挖掘,逐步发展到大数据、批流处理、OLAP即席查询,前后历经近40年,每次技术的升级都让数据世界在处理更实时、更大数据量、更多样的数据以及更准确可信的目标上更进一步。
OLAP(OnLine Analytical Processing,联机分析处理)是数据仓库系统的主要应用方式,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。OLAP引擎通常用于商业智能(BI)和数据仓库应用程序,它可以快速响应复杂的查询,并提供灵活的分析功能。OLAP引擎通常基于关系型数据库或多维数据存储技术构建,它可以处理大量的数据,并支持多种数据格式和数据源。
而2012年Facebook公司(现更名为Meta公司)发起的Presto项目现已发展成为较为成熟的OLAP引擎实现方案,在国内外都有较大的用户基数和多样的应用场景。
本书作者有多年一线互联网大厂的大数据软件开发和实践经验,同时在知乎专栏不遗余力地解读分享Presto原理和代码。本书详细介绍了OLAP引擎的应用场景和具体特点,以Presto实现为例子分模块(优化器、查询流程、分布式交换、连接器等)详细阐述OLAP引擎的实现思路并结合关键代码深入讲解,以帮助读者快速了解OLAP引擎的宏观设计思路和关键细节。
这是一本分析OLAP引擎以及Presto技术原理及实现的专业图书,对于想要了解并使用Presto的用户而言,这将是一本很好的参考书,对于已经了解并使用过Presto的用户而言,这也是一本可供日常翻阅的进阶读物。
凌志钧
字节跳动基础架构可观测负责人