(偏)自相关分析(acf/pacf)
算法操作 https://www.spsspro.com/ · 1138浏览 · 2022-01-12 07:09
一般来说(偏)自相关用于时间序列分析 AR、MA 的 p、q 进行定阶。

(偏)自相关分析(acf/pacf)

1、作用

自相关(ACF)是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性,而偏自相关函数(PACF)是在其他序列给定情况下的两序列条件相关性的度量函数。一般来说(偏)自相关用于时间序列分析 AR、MA 的 p、q 进行定阶。

2、输入输出描述

输入:1个序列数据定量变量 输出:pacf/acf 图,用于 AR、MA 的 p、q 进行定阶 ​

3、案例示例

案例:基于 5 年每月商品的销售量,已知一阶差分序列平稳,作一阶差分序列的(偏)自相关图。

4、案例数据

image.png (偏)自相关分析案例数据

5、案例操作

image.png Step1:新建分析; Step2:上传数据; Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

image.png step4:选择【(偏)自相关分析(pcaf/acf)】; step5:查看对应的数据数据格式,【(偏)自相关分析(pcaf/acf)】要求输入1个时间序列数据定量变量。 step6:设置差分阶层(注意:一般情况下,(偏)自相关分析要求序列平稳或者几阶差分序列平稳。若是原序列是平稳序列,则选择差分阶层为 0;若是原序列是非平稳序列,一阶差分序列是平稳序列,则选择差分阶层为 1;若是原序列是非平稳序列,一阶差分序列是非平稳序列,二阶差分序列是平稳序列,则选择差分阶层为 2。 (本例由于在单位根检验到原序列不平稳,一阶差分序列平稳,所以设置差分阶层为 1) step7:点击【开始分析】,完成全部操作。

6、输出结果分析

输出结果 1:模型残差自相关图(ACF)

image.png 图表说明:上图展示了自相关图(ACF),包括系数、置信上限和置信下限。由图可知,一阶和三阶自相关系数很明显地大于 2 倍标准差范围,且自相关系数衰减为小值波动的过程比较缓慢或非常连续,我们可以判断自相关图为拖尾。 ​

输出结果 2:模型残差偏自相关图(PACF)

image.png 图表说明:上图展示了偏自相关图(PACF),包括系数,置信上限和置信下限。由图可知,一阶和二阶偏自相关系数很明显地大于 2 倍标准差范围,自一阶偏自相关系数后,其余偏自相关系数都在 2 倍标准差范围以内,且二阶后偏自相关系数衰减为在零附近小值波动的过程非常突然。我们可以判断偏自相关图为截尾。

7、注意事项

出现以下情况,通常视为(偏)自相关系数 d 阶截尾: 在最初的 d 阶明显大于 2 倍标准差范围 之后几乎 95%的(偏)自相关系数都落在 2 倍标准差范围以内 且由非零自相关系数衰减为在零附近小值波动的过程非常突然 出现以下情况,通常视为(偏)自相关系数拖尾:

如果有超过 5%的样本(偏)自相关系数都落在两倍标准差范围之外 或者是由显著非 0 的(偏)自相关系数衰减为小值波动的过程比较缓慢或非常连续 分析自相关图和偏自相关图后,可以建立 ARMA 模型: 偏自相关(PACF)图在 p 阶进行截尾,自相关(ACF)图拖尾,ARMA 模型可简化为 AR(p)模型; 自相关(PACF)图在 q 阶进行截尾,偏自相关(ACF)图拖尾,ARMA 模型可简化为 MA(q)模型; 倘若自相关与偏自相关图均拖尾,可结合 PACF、ACF 图中最显著的阶数(最小值)作为 p、q 值; 倘若自相关与偏自相关图均截尾,可以选择更换更高的差分,或不适合建立 ARMA 模型; 推荐大家采用 ARIMA 的 AIC(排列组合所有参数,求解 AIC 值最小对应的组合参数)自动寻优方式,通过 PACF 与 ACF 图定阶方式不准确,也比较难有说服力。

8、模型理论

自相关系数和偏自相关系数是统计学中定义的概念,是用以反映变量之间相关程度的统计指标,只是两者表现的具体变量之间的关系有所不同。 自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象的讲就是度量自己过去的行为对自己现在的影响。 数学表示: image.png 根据 ACF 求出滞后 k 自相关系数ACF(k)时,实际上得到并不是 Z(t)与 Z(t-k)之间单纯的相关关系。 因为 Z(t)同时还会受到中间 k-1 个随机变量 Z(t-1)、Z(t-2)、……、Z(t-k+1)的影响,而这 k-1 个随机变量又都和 z(t-k)具有相关关系,所以自相关系数里面实际掺杂了其他变量对 Z(t)与 Z(t-k)的影响。 为了能单纯测度 Z(t-k)对 Z(t)的影响,引进偏自相关系数(PACF)的概念。对于平稳时间序列{Z(t)},所谓滞后 k 偏自相关系数指在给定中间 k-1 个随机变量 Z(t-1)、Z(t-2)、……、Z(t-k+1)的条件下,或者说,在剔除了中间 k-1 个随机变量 Z(t-1)、Z(t-2)、……、Z(t-k+1)的干扰之后,Z(t-k)对 Z(t)影响的相关程度。 数学表达: image.png

9、参考文献

[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com. [2] 于宁莉,易东云,涂先勤.时间序列中自相关与偏相关函数分析[J].数学理论与应用,2007(01):54-57.

相关推荐

默认标签 数据分析达人
2024年全国大学生数据分析实践赛获奖名单(初稿)公示

# 2024年全国大学生数据分析实践赛获奖名单(初稿)公示 2024年全国大学生数据分析实践赛自2024年8月16日开启,共计吸引了来自

知识竞赛 原创 · 1317浏览 · 09-04 08:07
2024数据分析实践赛A、B赛题公布!

**2024数据分析实践赛已于8月16日 18:00正式公布题目!** 完整题目、数据及论文提交格式下载方式: 一、直接通过赛氪网公告下

知识竞赛 原创 · 3511浏览 · 08-16 10:07
深入理解标准正态分布的峰度与偏度

本文阐述了峰度与偏度在统计学中的意义,及其对管理决策的影响。峰度反映数据分布尖锐度,偏度衡量对称性。理解两者有助于风险评估、市场预测和策略规划,促进更精准的决策,增强管理效能。通过有效利用这些统计概念,管理者能提升数据分析技能,优化决策流程。

其他 原创 · 1419浏览 · 07-08 04:40
0 条评论
    某人
    可输入 255
    SPSSPRO社区 扫码访问移动端