数据是数据挖掘的目标对象和原始资源,对数据挖掘最终结果起着决定性的作用。现实世界中的数据是多种多样的,具有不同的特征,这就要求数据的存储采用合适的数据类型,并且数据挖掘算法的适用性会受到具体的数据类型限制。另外,原始数据通常存在噪声、不一致、部分数据缺失等问题,为了达到较好的挖掘结果,有必要对这些数据进行预处理加工从而提高数据的质量。本章将介绍数据类型、数据预处理、数据相似性度量相关基础知识。 JwA8VNZO29EQm2ZzaPimDC9pB++JyFptFvk/B7WOowO1WS4r50/TZkkx8Oz7OMp4