admin 管理员组

文章数量: 1086019


2024年4月15日发(作者:后台怎么关闭)

想象一下,你的任务是:根据已有的历史时间数据,预测未来的趋势走向。作为一个

数据分析师,你会把这类问题归类为什么?当然是时间序列建模。

从预测一个产品的销售量到估计每天产品的用户数量,时间序列预测是任何数据分析

师都应该知道的核心技能之一。常用的时间序列模型有很多种,在本文中主要研究ARIMA

模型,也是实际案例中最常用的模型,这种模型主要针对平稳非白噪声序列数据。

时间序列概念

时间序列是按照一定的时间间隔排列的一组数据,其时间间隔可以是任意的时间单位,

如小时、日、周月等。通过对这些时间序列的分析,从中发现和揭示现象发展变化的规律,

并将这些知识和信息用于预测。比如销售量是上升还是下降,是否可以通过现有的数据预

测未来一年的销售额是多少等。

1 ARIMA(差分自回归移动平均模型)简介

模型的一般形式如下式所示:

1.1 适用条件

 数据序列是平稳的,这意味着均值和方差不应随时间而变化。通过对数变换或差分

可以使序列平稳。

 输入的数据必须是单变量序列,因为ARIMA利用过去的数值来预测未来的数值。

1.2 分量解释

 AR(自回归项)、I(差分项)和MA(移动平均项):

 AR项是指用于预测下一个值的过去值。AR项由ARIMA中的参数p定义。p值是

由PACF图确定的。

 MA项定义了预测未来值时过去预测误差的数目。ARIMA中的参数q代表MA项。

ACF图用于识别正确的q值

 差分顺序规定了对序列执行差分操作的次数,对数据进行差分操作的目的是使之保

持平稳。ADF可以用来确定序列是否是平稳的,并有助于识别d值。

1.3 模型基本步骤

1.31 序列平稳化检验,确定d值


本文标签: 时间 序列 预测 数据 模型