主要内容
■ 变量创建与重命名
■ 日期和缺失值操作
■ 数据类型转换
■ 数据集排序、合并与取子集
■ 数据集更新与比较
上一部分介绍了Python如何创建数据集和读取Excel、CSV、Txt等文件,但这仅是数据分析的第一步。在实际统计分析工作中,尤其在面对健康医疗大数据时,常需要对数据进行清洗、加工等前期准备工作,这部分工作比较麻烦,费时、费力。Python在数据前期处理工作中有着独特的优势。本部分主要介绍如何利用Pandas库进行数据清洗。 qtfTkbanMaRSGFzoZ9lTL1XtqP/IyQoAFbiCkeCdV6DCFQoEEE1V0F8pgj/xmeJe