本章内容
本章首先讲解Flink DataStream API的基本概念、流与批的执行模式;然后介绍Flink的作业流程、DataStream程序的结构,并重点讲解Source数据源、Transformation数据转换、Sink数据输出的相关API及操作;最后讲解Flink内置的分区策略和自定义分区策略以及DataStream API的窗口计算和数据流水印的处理,并对数据状态和容错处理进行进一步的讲解。
本章目标
* 了解Flink DataStream流计算的基本概念。
* 了解Flink的流与批的执行模式。
* 掌握Flink作业执行流程。
* 掌握Flink流程序的结构。
* 掌握Flink常用的Source数据源、数据转换等API。
* 掌握Flink分区策略和自定义分区。
* 掌握Flink窗口计算API的使用。
* 掌握Flink水印的原理及使用。
* 掌握Flink数据状态管理和容错机制的原理及使用。