admin 管理员组

文章数量: 1086019

pandas数据清洗:案例详解 fillna函数 填补空缺值

pandas数据清洗:fillna函数填补空缺值

  • 1 fillna函数简介
  • 2 填补空缺值3种方法
    • 2.1 构建学习数据
    • 2.2 填补特定值
    • 2.3 用前一个非空缺值填充
    • 2.4 用后一个非空缺值填充
    • 2.5 拓展
      • 2.5.1 均值填充
      • 2.5.1 中位数填充
      • 2.5.1 最大值填充
      • 2.5.1 最小值填充
      • 2.5.1 删除空缺值

1 fillna函数简介

fillna函数:用来填补数据中的空缺值

参数简介
value固定值填充
method‘ffill’ 用前一个非空缺值填充;‘bfill’ 用后一个非空缺值填充
axis‘index’:按行填充;'columns’按列填充
inplace是否用新生成的列表替换原列表

2 填补空缺值3种方法

2.1 构建学习数据

import pandas as pd 
df = pd.DataFrame([[np.nan, 2, np.nan, 0],[3, 4, np.nan, 1],[np.nan, np.nan, np.nan, 5],[np.nan, 3, np.nan, 4]],columns=list('ABCD'))
df

2.2 填补特定值

方法一:全部填写为同一特定值
df.fillna(value=10,method=None,axis=None,inplace=False)

方法二:按列填写不同特定值
values = {'A':11,'B':22,'C':33,'D':44}
df.fillna(value=values,method=None,axis=None,inplace=False)

2.3 用前一个非空缺值填充

方法三:'ffill' 填充
df.fillna(method='ffill',axis=None,inplace=False)

2.4 用后一个非空缺值填充

方法三:'bfill' 填充
df.fillna(method='bfill',axis='index',inplace=False)

2.5 拓展

2.5.1 均值填充

df.fillna(value=df.mean())

2.5.1 中位数填充

df.fillna(value=df.median())

2.5.1 最大值填充

df.fillna(value=df.max())

2.5.1 最小值填充

df.fillna(value=df.min())

2.5.1 删除空缺值

df.dropna()

详解请看博文
pandas数据清洗:drop函数详解、dropna函数详解、drop_duplicates函数详解

================================================================下面点个赞👍,加个收藏⭐,方便下次使用啊!

本文标签: pandas数据清洗案例详解 fillna函数 填补空缺值