在处理时间序列数据时,异常检测与根本原因分析是两个常见的应用场景。所谓时间序列数据,指的是在一段连续时间内收集的一系列数据点。
以电子商务为例,此类数据可能涵盖日交易量、平均交易额或退货数量等关键指标。
异常检测的核心任务是识别出那些不符合常规模式的数据波动,这些波动往往预示着潜在的问题,比如某特定产品订单量的突然激增,甚至可能是正在发生的欺诈行为。
无论何种情况,迅速定位并解决问题至关重要。过了24小时之后才发现问题是没有用的,时效性已失——我们需要的是在问题出现的那一刻就察觉!
一旦监测到异常,我们就需要深究引发这些异常的具体因素。换句话说,我们必须追溯到出现问题的根本原因。
这一场景要求系统能够每秒处理大量的时序扫描和分组(Group By)查询,以满足高查询量的需求。