pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

青葱年少 • 2023年3月8日下午10:26 • Python • 阅读 181

在处理缺失值的时候，总会遇到各种问题

import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)

先看看如下数据

import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)
# 删除表中全部为NaN的行
data = data.dropna(axis=0, how='all')
print(data)

输出：

pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)
# 删除表中含有NaN的行
data = data.dropna(axis=0, how='any')
print(data)

输出：

pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

# 删除全部为nan的列
data = data.dropna(axis=1, how='all')

数据如下：

pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

输出：

pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

# 删除包含nan的列
data = data.dropna(axis=1, how='any')

数据如下

pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

输出：

pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

数据如下:

pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

输出:
pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

10.有时候是空字符串的情况

nan_df = df[(df['xxx'].str.len() <= 5) | (df['xxx'].isna())]

文章出处登录后可见！

已经登录？立即刷新