1.在数据挖掘之前为什么要对原始数据进行预处理?
2.简述数据清理的基本内容。
3.简述数据预处理的方法和内容。
4.简述数据空缺值的处理方法。
5.数据约简的方法有哪些?
6.什么是数据规范化?规范化的常用方法有哪些?写出对应的变换公式。
7.计算数据对象 X=(3,5,2,7)和 Y=(6,8,2,3)之间的欧几里德距离、曼哈顿距离及闵可夫斯基距离,其中闵可夫斯基距离中p值取为3。
8.分析编辑距离与最长公共子序列这两个算法的异同。 7WFeSOihzNIZGAevV2t8YRJtRUmG0iNNUwJxdGuEpYawckeBiHlSy01UiS7vONte