数据清洗是数据处理的前序步骤,这部分的工作量高达90%以上,是确保分析质量不可缺少的环节。本报告所依据的数据主要由高精度医疗器械所采集,总的质量是偏高的。但由于各地医院提供的病例和检验单存在少量漏项错项,仍然需要进行繁琐的编辑、查重、基于逻辑的缺失值填补。数据清洗的过程示意如下: qoOiJyUN03E32mQMBW7XEl5kP29YhMHbgB91zKu5DQu+8JVHKeGfZ/wm8unlRY5k