购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

4.7 缺失数据填补

有时候,由于一些变量非常重要,缺失数据也不多,在分析前可以对缺失值进行填补。在Pandas中,fillna()是最主要的填补手段,通过调用fillna()可将缺失值替换为指定值,其格式为:DataFrame.fillna(value= None , method= None , axis= None , inplace= False , limit= None , downcast= None )。其中常见参数说明见表4-2。

表4-2 fillna()函数常见参数说明

以表4-3数据为例,以均数填补年龄的缺失值,以后面行数据填补性别的缺失值,同时填补文化和年收入的缺失值指定为3和5.5,如代码清单4-17所示。

表4-3 缺失数据资料

代码清单4-17 通过fillna()填充缺失数据

代码运行结果如下: ngRH8QZKd1ITAMc2qpZcH6Sgqho9ui148Zy0ExQzmx1a0RMVzgch/wfuG3c6UOEl

点击中间区域
呼出菜单
上一章
目录
下一章
×