模式识别与智能计算：Matlab技术实现（第2版）最新章节_杨淑莹著

2.5 特征评估

对原特征空间进行优化之后，就要对优化的结果进行评价，通过反复选择不同的特征组合，采用定量分析比较的方法，判断所得到的特征维数，及所使用特征是否对分类最有利，这种用以定量检验分类性能的准则称为类别可分离性判据，用来检验不同的特征组合对分类性能好坏的影响。对特征空间进行优化是一种计算过程，它的基本方法仍然是模式识别的典型方法，即找到一种准则（或称判据），通常用一种式子表示，使这种计算准则达到一个极值。对特征评估的方法大体分两类：一类以计算样品在特征空间离散程度为基础的准则，称为基于距离的可分性判据；另一类则基于概率密度分布的判据。

下面介绍基于距离的可分性判据。

给定一组表示联合分布的训练集，假定每一类的模式向量在观察空间中占据不同的区域是合理的，类别模式间的距离或平均距离则是模式空间中类别可分离性的度量。基于距离的可分性判据的出发点：各类样本之间的距离越大、类内散度越小，则类别的可分性越好。基于距离的可分性判据直接依靠样本计算，直观简捷，物理概念清晰，因此目前应用较为广泛。

在一个特征候选集X=［x ₁ ，x ₂ ，…，x _n ］所定义的n维特征空间中，用d（X _ik ，X _jl ）表示第i类中第k个样品和第j类中第l个样品间距离的度量值，距离度量d可采用式（2-3）定义的欧几里德距离计算：