Trino引擎在连接器生态、SQL语法、功能特性以及系统集成方面不断迭代发展。作为一个成功的开源项目,它已经有10多年的历史了,使用上也从一开始的Hadoop/Hive数据湖敏捷分析扩展到多种场景。目前连接器类型已经有几十种,从关系型数据库PostgreSQL到现在基于对象存储的表格式(如Iceberg、Delta Lake和Hudi等)系统都能够支持。放眼全球,Trino现在已经是业界多种数据平台的核心查询引擎了。
考虑到上述所有这些,我们很高兴许一腾和高英举运用他们的专业知识以及对中国Trino社区的了解撰写了这本技术书。这本书的内容丰富,不同类型的读者都能从这本书中受益。
这本书从技术上对Trino引擎进行了深度解析。它从OLAP的概述开始,介绍了一个Trino查询的经典处理流程。读者首先会了解处理简单SELECT查询的所有细节,然后以阶梯的方式深入到连接、聚合、行数限制以及其他高级功能的复杂原理。这本书还介绍了Trino的数据交换系统,它是高性能并行处理架构的基石。读者还可以了解Trino的插件体系,学习连接器是如何对数据源进行建模的,知道如何编写一个简单的连接器。在本书的最后读者还会学到插件的自定义函数,学会这部分大家就可以编写自定义函数来供自身业务的SQL查询使用了。
我们很高兴这本书能够成功出版。Trino社区遍布全球,中国社区无疑是重要组成部分。我们相信,中国社区中热情专业的用户、代码贡献者以及多个大型公司都在享受Trino这项技术并为之作出贡献,他们确保了中国社区的成功以及全球协作的顺利推进。
我们希望这本书能与Trino吉祥物“兔兔队长”一起为Trino的用户答疑解惑。期待后续从个人博客、Slack频道(特别是中国区频道general-cn)、Trino中国区活动、Trino社区广播、Trino论坛等渠道收到大家对这本书的反馈与心得。
Trino创始人Martin Traverso、DainSundstrom、David Phillips Trino维护者Manfred Moser