admin 管理员组

文章数量: 1184232


2024年4月24日发(作者:画出哈希表经典例题)

基于python软件的电商平台大闸蟹市场数据分析

1 绪论

1.1 研究背景

近年来,相关电商、物流公司深入大闸蟹的生产销售环节,越来越多的消费

者选择在网上购买大闸蟹,大闸蟹产业前途越来越光明,并随着信息科技的日益

进步,手机、电脑集成了越来越多简单实用的程序与工具。而使用这些程序的同

时产生了丰富的数据,因此研究这些数据对于电商平台以及分析人类的行为趋势

有着非常重要的意义。、

1.2 研究目的

在全面建成小康社会、加快步入社会主义现代化的关键时期,人民生活又来

极大的改善,大数据影响各行各业的发展,农产品的销售也不例外,因此人们对

电商平台大闸蟹市场选择以及质量都有了一定的要求。

2 数据来源及预处理

2.1 数据来源

本次收集数据共5090 组,数据来源于天元数据网收集于2018 年 9 月份,

天猫商城中关于大闸蟹的各个店铺销售数据。其中收集数据项包括:商品 id、商

品名称、品牌名称、价格、商品原价、商品销售量、商品销售额、商品 url、类

目 id、类目、商品评价数、商品收藏数、商品库存、商品发货地、商品产地国家、

商品参数、店铺id、店铺名称、店铺省份、店铺城市、店铺开店时间、店铺开店

年数。同时使用numpy 以及 pandas 中含有的数据分析包,来对其中的数据进

行可视化分析。

2.2 数据预处理

在进行数据分析前,先需要对数据进行清洗,可以通过Jupyter进行数据分

析时使用is_null()方法来找出异常的空值。

2.3 数据分析初步

通过四川人寿保险公司的新投保数据,一共有机构、险种、投保时间、缴费

方式、缴费期限、投保份数、总保费、保额、客户号、性别、年龄、婚姻状况、

过去三年平均年收入、教育程度、职业、家庭人口这十六列数据排序、分组、单

因素方差分析、简单相关分析以及探索分析的方法,对不同婚姻状况与保额的关

系、不同年龄与保额的关系、总保费与保额之间的关系、性别与过去三年的收入

的关系进行了分析,通过分析客户购买保险的情况,优化保险公司的保险种类和

保费,让客户根据自己的实际情况选择。

3 数据分析的方法及过程

3.1 数据分析方法简介

本文主要采用Python软件进行数据分析,Python不同于R语言以及Matlab,

Python具备非常强大的数据分析能力,同时Python还可以用于爬虫、游戏编写,

以及自动化运维,因此Python有利于多学科、多业务之间的融合,尽量减少一

个项目中使用过多的语言造成不兼容的情况,所以Python可以大大地提高工作

效率,而Python在运算效率上的缺失 也可以通过提升机器硬件来弥补,毕竟时

间成本有时远大于硬件成本。

数据分析是指在分析大批量数据研究时运用合理、适当、可行的方法对需要

分析的数据进行分析,提取其背后的信息,形成结论。这是一个数据研究和总结

的过程[,随着信息技术的发展与迭代,企业生产、收集、存储和处理数据的能力

有了质的飞跃,每天的数据吞吐量达到了惊人的地步。因此,利用数据分析方法

对复杂的数据进行细化,研究数据的发展规律并预测趋势,进而帮助企业的管理

层进行决策。

当开始数据分析项目时,通常首先分别分析每个变量,以描述拥有的数据并

评估其质量,接下来的步骤是探索变量之间存在的关系。这些关系可能会导致对

数据所代表的总体得出某些推论或结论。结论将会分析出数据集中并不存在的数

据。但是,在导致决策或行动步骤之前,数据分析无效。

最简单的则是描述性分析,描述性分析通过总结数据集中的变量值。例如,

调查者对一些特定的问题进行至10的评分,那么描述性分析可以通过总结受访

者的中位数、百分比或者数量,以及特定评分的一个趋势变化。描述性分析需要

熟悉数据集并识别数据问题。

探索性分析则是在进行数据分析之前,需要了解项目所拥有的数据,然后寻


本文标签: 数据 分析 商品 大闸蟹