SPSS】一文读懂面板模型选择
案例库 https://www.spsspro.com/ · 4050浏览 · 2022-08-25 11:39
面板模型是基于各样本(个体项)在时间序列(时间项)上组成的数据,综合样本信息来研究自变量 X 对因变量 Y 的影响。

常见的数据形式有时间序列数据(Time series data),截面数据(Cross-sectional data)和面板数据(Panel data)。从维度来看,时间序列数据和截面数据均为一维。面板数据可以看做为时间序列与截面混合数据,是截面上个体在不同时点重复观测数据,因此它是二维数据。数据形式如下:

image.png

只有地区项称为截面数据,只有时间项称为时间序列数据。

模型检验与模型选择

1、分析数据的平稳性

面板数据模型在回归前需检验数据的平稳性。为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。

单位根检验通过分析t值,分析其是否可以显著地拒绝序列不平稳的原假设(p<0.05),若呈显著性,表明拒绝序列不平稳的原假设,该序列为一个平稳的时间序列;若不呈显著性,则对数据进行二阶甚至高阶差分后检验,直至序列平稳为止,一般不超过二阶差分。

2、协整检验或模型修正

协整检验是考察变量间长期均衡关系的方法。协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。此时我们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。

3、面板模型的选择与回归

面板数据模型一般有三种形式可以选择:混合估计模型、固定效应模型、随机效应模型:

3.1 混合估计模型(POOL)

image.png

混合模型的特点是无论对任何个体或者截面,回归系数都是相同的。

不同个体之间不存在差异,不同时间项之间也不存在显著性差异,可以直接把面板数据混合在一起用普通最小二乘法估计参数。

3.2 固定效应模型(FE)

固定效应模型可分为三类:个体固定模型、时间固定效应模型、双向固定效应模型。

(1)个体固定效应模型:个体固定效应模型是对于不同的时间序列(个体)只有截距项不同的模型:

image.png

从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而目除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化。

(2)时点固定效应模型:时点固定效应模型就是对于不同的截面(时点)有不同截距的模型。如果确知对于不同的截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时点固定效应摸型:

image.png

(3)时点个体固定效应模型:时点个体固定效应模型就是对于不同的截面(时点)、不同的时间序列(个体)都有不同截距的模型。如果确知对于不同的截面、不同的时间序列(个体)模型的截距都显著不相同,那么应该建立时点个体固定效应模型:

image.png

此处的 FE 模型是仅指个体固定效应模型,它刻画了不同个体的特殊影响。而时间固定效应模型刻画了不同时间的特殊影响。

3.3 随机效应模型(RE)

随机效应模型与固定效应模型FE的区别在于对个体差别的定义,固定效应模型刻画了不同个体的特殊影响,个体间的差别反映在每个个体都有各自截距项;而随机效应模型则假设个体间的差别是随机的。由此固定效应模型更适合用于研究样本之间的区别,而随机效应更适合用于由样本来推断总体特征。比如,若假定想比较三种药物的疗效,可以直接建立固定效应模型FE;如果研究者的目的不是比较这三种药物的疗效差异,而是想要了解这三种药物所代表的三类药物的疗效差异,那么这就是随机效应模型RE。

在面板数据模型形式的选择方法上,我们经常采用F检验决定选用 POOL 模型还是 FE 模型,用 Breusch-Pagan 检验决定选用 RE 模型还是 POOL 模型,用 Hausman 检验决定选择 RE 模型还是 FE 模型。如下图所示:

image.png

根据各个形式的面板模型的结果进行对比,若在各个模型得F检验都通过的前提下,建议结合估计参数的显著性来确定面板模型。

案例介绍

根据 10 个地区(个体项)不同年份(时间项)的幸福度(因变量),以身体健康水平、受教育水平、经济水平、情感支持为自变量,建立面板模型。

image.png

软件操作

image.png

面板模型不支持自变量 x 为二分类以上的定类变量,如果有3个及以上的类别变量,那么建议使用数据处理功能转化为为虚拟变量(哑变量)然后再纳入模型。

image.png

结果解读

1)模型选择

image.png

根据 F 检验,显著性 P 值为 0.03447435626130291,水平上呈现显著性,拒绝原假设,选择 FE 模型。

根据 Breusch-Pagan 检验,显著性 P 值为 0.8005643848369582,不呈现显著性,不能拒绝原假设,选择 POOL 模型。

根据 Hausman 检验,显著性 P 值为 3.9655226104970715e-22,水平上呈现显著性,拒绝原假设,选择 FE 模型。

综上考虑,这里选取FE模型。

三个检验是为了确定个体固定效应的存在,而不针对于时间固定效应。若是想检验时间固定效应是否存在,建议线性回归最小二乘方法,将时间项化成哑变量纳入模型中,如果时间项基本均呈现出显著性,说明可以考虑时间固定效应。若是证明既存在个体固定又存在时间固定,那么就可以建立用个体-时间双向固定效应模型。

2)面板模型结果

image.png

由于在之前的检验中选择了 FE 固定效应模型,所以这里只对该模型的估计结果进行分析(其他两种模型SPSSPRO也有展示)。FE 固定效应模型的 F 检验结果显示,显著性 p 值为 0.003***,水平上呈现显著性,拒绝原假设,因此模型是有效的。

相关推荐

默认标签 数据分析达人
第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!

第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!

知识竞赛 2024年第三届全国大学生数据分析实践赛组委会 · 1191浏览 · 01-07 08:34
2024年全国大学生数据分析实践赛获奖名单(初稿)公示

# 2024年全国大学生数据分析实践赛获奖名单(初稿)公示 2024年全国大学生数据分析实践赛自2024年8月16日开启,共计吸引了来自

知识竞赛 原创 · 2005浏览 · 2024-09-04 08:07
2024数据分析实践赛A、B赛题公布!

**2024数据分析实践赛已于8月16日 18:00正式公布题目!** 完整题目、数据及论文提交格式下载方式: 一、直接通过赛氪网公告下

知识竞赛 原创 · 4507浏览 · 2024-08-16 10:07
0 条评论
    某人
    可输入 255
    SPSSPRO社区 扫码访问移动端