购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.2 数据的索引

索引是对数据中一列或多列的值进行排序的一种结构,使用索引可快速访问数据中的特定信息。本节将会介绍Python如何创建索引、重构索引、调整索引等,使用的数据文件为“不同地区商品退单量2.xls”。

3.2.1 创建与查看索引

在创建索引之前,我们首先创建一个不同地区商品退单量的数据集,示例代码如下:

运行上述代码,创建的数据集如下:

使用index可以查看数据集的索引,默认是从0开始步长为1的数值索引,示例代码和输出如下:

     return.index
RangeIndex(start=0, stop=6, step=1)

set_index()函数可以将其一列转换为行索引,示例代码和输出如下:

set_index()函数还可以将其多列转换为行索引,示例代码和输出如下:

默认情况下,索引列字段会从数据集中移除,但是通过设置drop参数也可以将其保留下来,示例代码和输出如下:

3.2.2 索引重构与恢复

reset_index()函数的功能跟set_index()函数刚好相反,层次化索引的级别会被转移到数据集中的列里面,示例代码和输出如下:

可以调用unstack()方法对数据集进行重构,类似于pivot()方法,不同之外在于unstack()方法是针对索引或者标签,即将列索引转成最内层的行索引;而pivot()方法则是针对列的值,即指定某列的值作为行索引,示例代码和输出如下:

此外,stack()方法是unstack()方法的逆运算,示例代码和输出如下:

3.2.3 索引调整与排序

有时可能需要调整索引的顺序,swaplevel()接收两个层级的编号或名称,并返回一个互换了层级的新对象,例如对年份和地区的索引层级进行调整,示例代码和输出如下:

sort_index()函数可以对数据进行排序,参数level设置需要排序的列,注意这里的列包含索引列,第一列是0(“年份”列),第二列是1(“地区”列),示例代码和输出如下: Hntr3d9OCczGZCWlPx0KDM6J/TikDYaKh5K4O619rF9qY+2W5nAoSWnWXpw593ND

点击中间区域
呼出菜单
上一章
目录
下一章
×