admin 管理员组文章数量: 1086019
Black
一、数据集简介
黑色星期五---通过消费者行为研究销售
数据集包含55万个零售商店在黑色星期五的销售记录,它包含不同种类的变量或数字或分类。它包含缺失的值。数据集来自Analytics Vidhya主办的竞赛。
二、数据导入
使用panda将数据导入为数据框类型,为 bf
三、处理缺失值
1.检查是否存在缺失值
Product_Category_2和Product_Category_3返回值为True,只有该2个字段存在缺失值。而User_ID 和Product_ID不存在缺失值,数据较为完整。
2.计算缺失值的比率
Product_Category_3的缺失值较高,约达70%
3.缺失值填充
Product_Category的取值为数字,可理解为表示商品属于该类别的程度(0-18),使用 0 填充。并检查是否替换成功。
缺失值处理完毕
未完待续。。。。。。
本文标签: Black
版权声明:本文标题:Black 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1698591297a310221.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论