优草派  >   Python

Python DataFrame如何根据列值选择行?

黄佳欣            来源:优草派

在数据分析和机器学习中,DataFrame是一个常用的工具。DataFrame是Pandas库中的一种数据结构,它类似于Excel表格,可以存储和处理数据。在Pandas中,我们经常需要根据列值选择行,这在数据分析中非常常见。本文将从多个角度分析如何根据列值选择行。

一. 使用loc方法

Python DataFrame如何根据列值选择行?

如果我们想根据某一列的值选择行,可以使用loc方法。loc方法可以根据标签选择行,其语法如下:

```

df.loc[df['列名'] == '值']

```

例如,我们有以下的DataFrame:

```

import pandas as pd

data = {'姓名': ['张三', '李四', '王五', '赵六'],

'年龄': [20, 21, 22, 20],

'成绩': [80, 85, 90, 75]}

df = pd.DataFrame(data)

```

如果我们只想选择年龄为20岁的行,可以使用以下代码:

```

df.loc[df['年龄'] == 20]

```

输出结果:

```

姓名 年龄 成绩

0 张三 20 80

3 赵六 20 75

```

二. 使用query方法

Pandas还提供了一个query方法,它可以根据表达式选择行。query方法的语法如下:

```

df.query('表达式')

```

例如,我们要选择成绩大于80的行,可以使用以下代码:

```

df.query('成绩 > 80')

```

输出结果:

```

姓名 年龄 成绩

1 李四 21 85

2 王五 22 90

```

三. 使用isin方法

如果我们想选择某一列的多个值,可以使用isin方法。isin方法可以判断某一列的值是否在给定的列表中,其语法如下:

```

df[df['列名'].isin(['值1', '值2', ...])]

```

例如,我们想选择年龄为20岁或22岁的行,可以使用以下代码:

```

df[df['年龄'].isin([20, 22])]

```

输出结果:

```

姓名 年龄 成绩

0 张三 20 80

2 王五 22 90

3 赵六 20 75

```

四. 使用query方法和in关键字

我们还可以结合query方法和in关键字,选择某一列的多个值。其语法如下:

```

df.query('列名 in (值1, 值2, ...)')

```

例如,我们想选择姓名为张三或李四的行,可以使用以下代码:

```

df.query('姓名 in ("张三", "李四")')

```

输出结果:

```

姓名 年龄 成绩

0 张三 20 80

1 李四 21 85

```

五. 使用布尔值选择行

我们还可以使用布尔值选择行。在Pandas中,任何布尔值都可以用于选择行。例如,我们可以使用以下代码选择成绩大于80且年龄为20岁的行:

```

df[(df['成绩'] > 80) & (df['年龄'] == 20)]

```

输出结果:

```

姓名 年龄 成绩

0 张三 20 80

```

六. 使用query方法和逻辑运算符选择行

我们还可以结合query方法和逻辑运算符选择行。逻辑运算符包括and、or、not等。例如,我们可以使用以下代码选择成绩大于80且年龄为20岁的行:

```

df.query('成绩 > 80 and 年龄 == 20')

```

输出结果:

```

姓名 年龄 成绩

0 张三 20 80

```

综上所述,我们可以使用多种方法根据列值选择行,包括使用loc方法、query方法、isin方法、布尔值选择行以及query方法和逻辑运算符选择行。这些方法可以帮助我们快速地进行数据筛选和数据分析。

【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。
TOP 10
  • 周排行
  • 月排行