最简单的识别方法就是模板匹配,就是把未知样品和一个标准模板相比,看它们是否相同或相似。下面讨论两类别和多类别的情况。
(1)两类别
设有两个标准样品模板为A和B,其特征向量为 n 维特征: X A =( x A1 , x A2 ,…, x A n) T 和 X B =( x B1 , x B2 ,…, x B n) T 。任何一个待识别的样品 X ,其特征向量为: X =( x 1 , x 2 ,…, x n ) T ,那么,它是A,还是B呢?
用模板匹配方法来识别,若 X = X A ,则该样品为A,若 X = X B ,则该样品为B。怎样知道 X = X A ,还是 X = X B 呢?最简单的识别方法就是利用距离来判别。如果 X 距离 X A 比距离 X B 近,则 X 属于 X A ,否则属于 X B 。这就是最小距离判别法。
任意两点 X , Y 之间的距离:
根据距离远近可作为判据,构成距离分类器,其判别法则为
(2)多类别
设有 M 个类别: ω 1 , ω 2 ,…, ω M 。每类由若干个向量表示,如 ω i 类,有
对于任意被识别的样品 X ,有
计算距离 d ( X i , X ),若存在某一个 i ,使
即到某一个样品最近,则 X ∈ ω i 。
具体判别时, X , Y 两点距离可以用| X - Y | 2 表示,即
式中的 为特征的线性函数,可作为判别函数
若 d ( X , X i )=min d i ( X ),则 X ∈ ω i 。这就是多类问题的最小距离分类法。
①待测样品 X 与训练集里每个样品 X i 的距离为 d ( X , X i )=| X - X i | 2 。
②循环计算待测样品和训练集中各已知样品之间的距离,找出距离待测样品最近的已知样品,该已知样品的类别就是待测样品的类别。
远行效果如图3‐5所示。
图3‐5 模板匹配法