购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.2 空战数据来源介绍

目前,现有的空战数据主要来自飞参系统和飞行训练系统。飞参系统采集的机载总线数据反映了飞行过程中各机载设备的工作状态,飞行训练结束后,飞参系统配合维护人员的人工判读,可以有针对性地排除设备故障,节省排除故障的时间。飞行训练系统是另一种飞行数据采集系统,它可以通过实时下传飞机状态信息为地面引导人员提供安全监控;飞行训练结束后,它可以复盘空战训练的全过程,为飞行员训练讲评提供依据。本书以某型训练系统采集的飞机信息为主要研究对象。

飞行训练系统主要由机载模块和地面模块两部分组成。机载模块的主要功能是采集飞行数据并向地面发送,该模块主要包括 GPS 定位模块、火控信息采集模块、导航模块和电台模块。飞机飞行时,GPS 模块主要计算飞机的位置信息;火控信息采集模块主要采集武器总线上的火控信息;导航模块主要计算载机的姿态信息;电台模块负责将采集的飞机航向、三维姿态、机载雷达信息组合成数据包,以 0.25s 的周期向地面模块发送,确保对空战态势的实时监控。地面模块主要由通信电台、显控台和数据融合模块组成,通信电台负责接收下传的飞机状态信息;显控台负责实时显示飞机的三维态势、飞行轨迹及导弹发射后的运行轨迹;数据融合模块主要完成战机态势信息的融合处理。

2.2.1 空战数据结构

空战过程中,飞行训练系统实时采集攻防对抗的态势信息,攻防对抗的态势信息包括单机态势数据和导弹发射事件数据。导弹发射事件记录导弹发射时刻双方的位置信息、速度信息及导弹是否命中目标等信息。由于单机态势数据包括导弹发射事件数据,因此本节主要对单机态势数据的数据结构进行说明。

单机态势数据反映了飞机在空战中实时的飞行状态,它由机载模块通过电台模块用数据包格式以 0.25s 的周期下传至地面模块。在一对一攻防对抗中,双方通过各自的机载模块分别下传态势信息,地面模块经过数据融合模块将双方的态势信息打包处理。也即每 0.25s 显控台收到敌我双方数据各 1 包,每包数据主要包含飞行员代号、飞行日期、飞行时长、经度、纬度、高度、速度、航向角、横滚角和俯仰角,单机态势数据结构如表 2.1 所示。

表 2.1 单机态势数据结构

表2.1中各项数据示例说明如下:

表 2.1 中所示数据为飞行员 A 驾驶的某型飞机的态势信息。飞行日期 20190710 表示该架次的空战对抗日期是 2019 年 7 月 10 日;为了方便后续的数据处理,我们将空战时长转换为以秒为单位的数据,飞行时长 34716.75 表示从 7 月 10 日空战开始时刻到接收数据包的时刻空战持续了 34716.75s;当前时刻的飞机位置通过经度、纬度、高度 3 个变量确定;航向角、横滚角、俯仰角确定了当前时刻飞机的姿态。

2.2.2 空战数据预处理

由于数据包中的各项指标具有不同的量纲和量纲单位,如果直接对这些原始数据进行处理,会影响数据分析的结果。因此,有必要对采集的原始数据进行标准化处理,消除各个评价指标之间的量纲影响。经过标准化处理的数据,各个指标处于同个数量级,适合进行客观的数据分析。常见的数据标准化方法主要有最小最大标准化法、零均值标标准化法和小数定标标准化法。

(1)最小最大标准化法。该方法首先求解数据样本中各个指标的最大值和最小值,然后将原始数据映射至[0,1]区间内,两者之间的转换函数如下:

(2.1)

式中, x min 为数据集中某一指标的最小值; x max 为数据集中某一指标的最大值。

这种方法的不足之处在于,当数据集中有新的数据加入时,数据集的最大值和最小值可能发生动态变化,需要重新计算数据集的标准化。

(2)零均值标准化法。该方法首先需要求解数据集中各个指标的均值和标准差。经过零均值处理后,数据符合标准的正态分布,即数据样本的均值为 0、标准差为 1,具体的转换函数如下:

(2.2)

式中, μ 为数据样本的均值; σ 为数据样本的标准差。当数据样本求解最大值和最小值比较困难,或无法求解最大值和最小值,或存在超出某一指标取值范围的离群数据时,这种方法比较适用。

(3)小数定标标准化法。该方法主要采用移动数据的小数点位置进行标准化,其定标标准取决于该指标的最大值,具体的转换函数如下:

(2.3)

这种方法主要由各个指标数据最大值的位数决定,当某一指标的最大值为 7821 时,则式(2.3)中 j =4。

由于本书采用的数据样本来自某型训练系统,其数据样本的最大值和最小值便于求解。为了简化运算,本书采用最小最大标准化法对数据进行预处理。 P9IWagzQVT2q5OccNmef04GZgk8K7U+xmOXPDITrIXPGwHl6DehJMti6y9LbsqYh



2.3 基于密度峰值聚类算法的空战态势分类

2.3.1 密度峰值聚类算法理论

聚类分析是一种无监督学习方法,广泛应用于图像识别、文档分类等领域,常见的聚类分析方法有K-means、Mean Shift、DBSCAN等。其中,K-means方法简单、易于实现,但是局限于聚类数目和聚类中心的选择;MeanShift与K-means一样,是一种基于聚类中心的算法,但是不需要预先指定聚类中心的数目,其聚类中心由给定区域的样本均值来确定;DBSCAN是一种基于密度的聚类分析方法,与K-means、Mean Shift两种方法相比,DBSCAN能够较好地处理非球状结构的数据,可以发现任意形状的聚类,但是DBSCAN方法受其邻域半径和阈值两个预置参数的约束,对预置参数比较敏感,时间开销较大。2014年,Alex Rodriguez等人提出密度峰值聚类算法,该算法基于两个假设:①聚类中心总是被其他低密度点包围;②聚类中心与其他较高密度点间的距离相对较远。基于密度峰值的聚类算法不需要事先指定聚类的类别数,能够聚类任意形状的类簇。

密度峰值聚类算法有两个重要的变量:一是衡量数据点局部密度的变量 ,二是描述数据点相对距离的变量 。数据样本表示为:

式中, i =1, 2, …, n m 表示数据样本的维数; n 表示样本数。密度峰值聚类算法有高斯核和截断核两种计算局部密度 的方法。

(1)截断核法。该方法的表达式如下:

(2.4)

式中, 表示两个数据点之间的欧氏距离, d c 表示数据点的截断距离, d c>0。函数 χ ( x )表示为:

(2.5)

(2)高斯核法。该方法的表达式如下:

(2.6)

高斯核法和截断核法的不同之处在于:截断核法表示的局部密度是指在聚类中心邻域内样本点的个数;高斯核法表示的局部密度是指聚类中心邻域内样本点到聚类中心的高斯距离之和。当数据样本量较大时,截断核法比高斯核法更具优势;相反,在样本数量不大时,用高斯核法表示的局部密度效果较为明显。

数据点 x i 的相对距离 定义为:

(2.7)

当数据点 的局部密度最大时, 表示数据集中与数据点 的最大距离;当数据点 的局部密度不是最大时, 表示在所有局部密度大于 的数据点中,与 距离最近的数据点之间的距离。

每个数据点的局部密度 和相对距离 组成一对二维坐标( ),在二维平面中将其表示出来。由于聚类中心具有较大的局部密度,并且距离其他密度较高点相对较远,因此确定局部密度 和相对距离 同时较大的点为聚类中心。

2.3.2 空战态势分类模型

空战过程中,敌我对峙的态势可以划分为敌方优势、我方优势、双方均势、双方劣势 4 类,这 4 类典型的态势在数据特征方面具有明显的差异。假设在多维空间内,这 4 类态势类型是聚集的,并且各类态势类型与其他态势类型之间具有较大差异。因此,本节通过密度峰值聚类算法构建空战态势分类模型。

具体的密度峰值态势分类步骤如下:

(1)数据集的标准化处理,采用 2.2.2 节中的最小最大标准化法处理样本数据。

(2)计算各个数据样本点之间的欧氏距离 。由于飞行训练系统采集的样本数据量较大,因此主要采用截断核法确定局部密度 ,同时确定各个样本点的相对距离

(3)密度峰值聚类算法在确定聚类中心时的主要依据是局部密度和相对距离的二维图,以局部密度和相对距离同时较大的样本点作为聚类中心。为了避免确定聚类中心时人为因素的影响,本书在原来决策图确定聚类中心的基础上提出了一种新的聚类中心确定方法。在密度峰值聚类算法中,局部密度和相对距离同时作用影响聚类中心点的选择,设 γ i = ρ i δ i γ i 值更大的点则有更大的可能是聚类中心。对 γ i 进行排序可知,一旦聚类中心的数目确定,聚类算法的阈值 γ i * 即可确定,则聚类中心即可确定。 P9IWagzQVT2q5OccNmef04GZgk8K7U+xmOXPDITrIXPGwHl6DehJMti6y9LbsqYh

点击中间区域
呼出菜单
上一章
目录
下一章
×