购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.5聚类分析

前面介绍的分类问题是利用已知类别的样品(训练集)来构造分类器的。其训练集样品是已知类别的,所以又称为有监督学习(或有教师分类)。在已知类别样品的“指导”(监督)下对单个待测样品进行分类。聚类问题则不同,它是事先不了解一批样品中的每一个样品的类别或其他的先验知识,而唯一的分类根据是样品的特性。利用样品的特性来构造分类器。这种分类称为无监督分类,通常称为聚类或集群。

聚类分析是指事先不了解一批样品中的每一个样品的类别或其他的先验知识,而唯一的分类根据是样品的特征,利用某种相似性度量的方法,把特征相同或相近的归为一类,实现聚类划分。

聚类分析就是对探测数据进行分类分析的一个工具,许多学科要根据所测得的或感知到的相似性对数据进行分类,把探测数据归入到各个聚合类中,且在同一个聚合类中的模式比不同聚合类中的模式更相似,从而对模式间的相互关系做出估计。聚类分析的结果可以被用来对数据提出初始假设,分类新数据,测试数据的同类型及压缩数据。

聚类算法的重点是寻找特征相似的聚合类。人类是二维的最佳分类器,然而大多数实际的问题涉及到高维的聚类。对高维空间内的数据的直观解释,其困难是明显的,另外,数据也不会服从规则的理想分布,这就是有大量聚类算法出现在文献中的原因。在图像中进行聚类分析,一幅图像中含有多个物体,需要对不同的物体分割标识。 6bdtG4NXmjckZ4vLGpobPXzJMOLVMvBneVPj4cbO03uJq8LB3t2NT1udQsVIZc6P

点击中间区域
呼出菜单
上一章
目录
下一章
×