优草派  >   Python

Dataframe查看索引

刘芳            来源:优草派

Dataframe是Pandas中最常用的数据结构之一,它是由多个Series组成的二维表格,每个Series表示表格的一列。在Dataframe中,除了数据本身,还有一些重要的信息,比如索引。索引是Dataframe中用来标识数据的非常重要的一部分,它可以用来访问、筛选和操作数据。在本文中,我们将从多个角度分析如何查看Dataframe的索引。

一、查看Dataframe的行索引

Dataframe查看索引

在Dataframe中,行索引是用来标识每一行数据的,通常用数字或字符串表示。要查看行索引,可以使用index属性。例如,我们可以创建一个简单的Dataframe,并查看它的行索引:

```

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Alice'],

'age': [20, 30, 25],

'gender': ['M', 'M', 'F']}

df = pd.DataFrame(data)

print(df.index)

```

输出结果为:

```

RangeIndex(start=0, stop=3, step=1)

```

这里的RangeIndex表示行索引是一个范围索引,从0开始,到3结束,步长为1。可以看出,这个Dataframe有3行数据,行索引分别为0、1和2。

二、查看Dataframe的列索引

在Dataframe中,列索引是用来标识每一列数据的,通常用字符串表示。要查看列索引,可以使用columns属性。例如,我们可以创建一个简单的Dataframe,并查看它的列索引:

```

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Alice'],

'age': [20, 30, 25],

'gender': ['M', 'M', 'F']}

df = pd.DataFrame(data)

print(df.columns)

```

输出结果为:

```

Index(['name', 'age', 'gender'], dtype='object')

```

这里的Index表示列索引是一个索引对象,包含3个元素,分别为name、age和gender,它们的数据类型是object。

三、查看Dataframe的多级索引

在Dataframe中,有时会使用多级索引来表示更复杂的数据结构。多级索引可以看作是以元组形式表示的复合索引,其中每个元素都代表一个层级的标签。要查看多级索引,可以使用index属性或columns属性的levels方法。例如,我们可以创建一个简单的Dataframe,并设置它的多级行索引:

```

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Alice', 'Tom', 'Jerry', 'Alice'],

'year': [2019, 2019, 2019, 2020, 2020, 2020],

'gender': ['M', 'M', 'F', 'M', 'M', 'F'],

'score': [80, 90, 85, 85, 95, 90]}

df = pd.DataFrame(data)

df.set_index(['name', 'year'], inplace=True)

print(df.index)

print(df.index.levels)

```

输出结果为:

```

MultiIndex([('Tom', 2019),

('Jerry', 2019),

('Alice', 2019),

('Tom', 2020),

('Jerry', 2020),

('Alice', 2020)],

names=['name', 'year'])

[['Alice', 'Jerry', 'Tom'], [2019, 2020]]

```

这里的MultiIndex表示行索引是一个多级索引,包含两个层级,分别为name和year。每个层级的标签分别为Alice、Jerry、Tom和2019、2020。可以看出,这个Dataframe有6行数据,每一行数据都由name和year两个层级的标签唯一确定。

四、查看Dataframe的索引类型

在Dataframe中,索引可以有不同的类型,常见的有整数索引、标签索引、时间索引等。要查看索引的类型,可以使用index属性的dtype方法。例如,我们可以创建一个简单的Dataframe,并设置它的整数行索引:

```

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Alice'],

'age': [20, 30, 25],

'gender': ['M', 'M', 'F']}

df = pd.DataFrame(data)

df.set_index([0, 1, 2], inplace=True)

print(df.index.dtype)

```

输出结果为:

```

int64

```

这里的int64表示行索引是一个整数索引。

五、查看Dataframe的索引值

在Dataframe中,索引值是指索引中的具体标签。要查看索引值,可以使用index属性的values方法或to_numpy方法。例如,我们可以创建一个简单的Dataframe,并查看它的行索引值:

```

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Alice'],

'age': [20, 30, 25],

'gender': ['M', 'M', 'F']}

df = pd.DataFrame(data)

print(df.index.values)

print(df.index.to_numpy())

```

输出结果为:

```

[0 1 2]

[0 1 2]

```

可以看出,这个Dataframe的行索引值分别为0、1和2。

综上所述,查看Dataframe的索引可以从多个角度分析,包括查看行索引、列索引、多级索引、索引类型和索引值等。掌握这些技巧可以更好地理解和操作Dataframe中的数据。

【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。
TOP 10
  • 周排行
  • 月排行