购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.1 引言

现实世界中数据大体上都是不完整、不一致的脏数据,无法直接进行数据挖掘,或者挖掘结果差强人意。为了提高数据挖掘 [ 1~3 ] 的质量产生了数据预处理技术 [4~6] 。数据预处理有多种方法:数据清理、数据集成、数据变换、数据归约等。这些数据处理技术在数据挖掘之前使用,有效地提高了数据挖掘模式的质量,降低了实际挖掘所需要的时间。

用于健康状态诊断的历史数据量相当庞大,且其特征属性众多,若直接用作诊断模型的输入,不但增加了模型的复杂程度,而且随着输入节点增加,噪声数据也同时增多,反而不利于诊断模型的精确度。为此,本章给出一个基于灰色粗糙集的二阶段数据预处理的改进算法,并将其作为对诊断数据属性空间的预处理方法,该算法有效地降低了算法的时间复杂度,对于在线诊断有更好的效果 [7] 8yPzoWwVHzwxN/sDGavy5moZtum05M+CSR6S+q9y4XUaLyvpgx0aMhz3L4YH8n8i

点击中间区域
呼出菜单
上一章
目录
下一章
×