admin 管理员组

文章数量: 1086019

Black

一、数据集简介

黑色星期五---通过消费者行为研究销售

数据集包含55万个零售商店在黑色星期五的销售记录,它包含不同种类的变量或数字或分类。它包含缺失的值。数据集来自Analytics Vidhya主办的竞赛。

二、数据导入

使用panda将数据导入为数据框类型,为 bf

 

三、处理缺失值

1.检查是否存在缺失值

Product_Category_2和Product_Category_3返回值为True,只有该2个字段存在缺失值。而User_ID 和Product_ID不存在缺失值,数据较为完整。


2.计算缺失值的比率

 

Product_Category_3的缺失值较高,约达70%

3.缺失值填充

Product_Category的取值为数字,可理解为表示商品属于该类别的程度(0-18),使用 0 填充。并检查是否替换成功。

缺失值处理完毕

 

未完待续。。。。。。

 

 

 

 

 

 

 

 

 

 

本文标签: Black