如何在 Pandas DataFrame 列中搜索值?

在 DataFrame 列中搜索值的 Python Pandas 代码示例

在任何机器学习或数据科学项目中处理大型数据集时,都需要在特征中搜索某些值,而对于这些值,我们需要从其他特征中获取值。在数据集中搜索值可能听起来很复杂,但 Python Pandas 让它变得简单。

下面的 Python Pandas 代码执行以下操作:

1. 创建数据字典并将其转换为 Dataframe

2. 使用“where”函数过滤出所需的数据列。pandas.DataFrame.where() 函数类似于 if-then 惯用语,它检查条件以相应地返回结果。

用于在 DataFrame 中查找值的 Python Pandas 示例代码

下面是 python 中的 pandas 代码,用于在 Pandas DataFrame 列中搜索值 –

第 1 步 – 导入库

import pandas as pd

我们只导入了此代码示例所需的 python pandas 库。

第 2 步 – 设置数据

我们已经创建了一个数据字典并将其传递给 pd.DataFrame 以创建一个包含“first_name”、“last_name”、“age”、“Comedy_Score”和“Rating_Score”列的数据框。

raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
            'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
            'age': [42, 38, 36, 41, 35],
            'Comedy_Score': [9, 7, 8, 8, 5],
            'Rating_Score': [25, 25, 49, 62, 70]}

df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age',
                                       'Comedy_Score', 'Rating_Score'])
print(df)

第 3 步 – 在 DataFrame 中搜索值

我们在特征 Rating_Score 中搜索值小于 50 的数据,对于这些值,我们在 comedy_Score 中选择相应的值。

print(df['Comedy_Score'].where(df['Rating_Score'] < 50))

输出如下所示 –

first_name last_name age Comedy_Score Rating_Score

0 Sheldon Copper 42 9 25

1 Raj Koothrappali 38 7 25

2 Leonard Hofstadter 36 8 49

3 Howard Wolowitz 41 8 62

4 Amy Fowler 35 5 70

0 9.0

1 7.0

2 8.0

3 NaN

4 NaN

Name: Comedy_Score, dtype: float64

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年3月6日 上午9:36
下一篇 2023年3月6日 上午9:37

相关推荐