数据是数据挖掘的目标对象和原始资源,对数据挖掘的最终结果起着决定性的作用。现实世界中的数据是多种多样的,具有不同的特征,这就要求数据的存储采用合适的数据类型,并且数据挖掘算法的适用性会受到具体的数据类型限制。另外,原始数据通常存在噪声、不一致、部分数据缺失等问题,为了达到较好的挖掘结果,有必要对这些数据进行预处理加工,从而提高数据的质量。本章将介绍数据类型、数据特征分析、数据预处理、数据的相似性等相关基础知识。 FK6v+U2oGrN2TfY+Xj1KSr12s0ZdxEX5FivMoDvRHkrQj3gAyckTcH5BJhyeQEjD