数学小白如何理解路径分析?
案例库 spsspro · 5815浏览 · 2022-04-08 06:45
路径分析线性回归中介效应傻傻分不清?

1 路径分析概述

1.1 介绍

学过线性回归的人都知道,多重线性回归反映的是自变量与因变量之间的直接作用,但是变量间的关系往往错综复杂,有的是单向影响关系,有的是互相影响关系,分析者只用一个回归模型往往是很难把所有的关系表达清楚的,这时就考虑用到路径分析。我们可以举一个最简单的生活例子来说明情况的复杂性。

如下图所示,这是一个经过简化的关于幸福感的分析模型:

image.png

该模型包含五个因素:情感支持水平和身体健康水平是影响幸福感的最主要因素;受教育程度对幸福感也有影响;经济水平和受教育程度同时又对情感支持水平有影响,然后再通过情感支持水平对幸福感产生间接的作用。该模型显然不能仅用一个简单的多元线性回归方程就解释清楚。面对这样错综复杂的变量关系,路径分析能对模型进行剥丝抽茧逐步解析。上图就是路径分析的重要工具——路径图。

上方路径图可以拟合出两个多重线性回归方程:

情感支持水平=常数+经济水平+受教育程度

幸福度=常数+情感支持水平+受教育程度+身体健康水平

从整理得到的两个多重线性回归模型可以发现,在路径分析图中,有的变量不受其余变量的影响,只影响其他变量;而有的变量既受其他变量的影响,又能够影响其它变量。

其中,情感支持水平在第一个方程中是因变量,但在第二个方程中是自变量。通过这两个方程可以知道,受教育程度对幸福度的作用是由两部分构成的,第一部分是对幸福度的直接影响,第二部分是通过先影响情感支持水平,然后再通过情感支持水平的作用间接影响幸福度。如果在制作路径分析图时只考虑到第二个方程而忽视第一个方程,那么就会因为只反映直接影响导致相应的回归系数估计值不够准确,甚至难以解释。

联系自变量共线性问题,受教育程度和情感支持水平在第二个方程里的关系就是共线性关系,所以路径分析模型可以从根本上对存在共线性的变量给出彻底的解决方法。

1.2 路径分析的基本步骤

1.21 模型设定

路径分析首先需要根据专业知识,初步假设出模型中各变量的相互关系,这种关系可以被绘制成一张清晰的路径分析图,随后按照路径分析图假定的因变量数量拟合出多个多重线性回归方程,所以路径分析模型是由一组线性方程构成的。路径分析模型描述的变量间相互关系不仅包括直接的,还包括间接的关联。

1.22 模型评价

评价各路径的样本数据拟合程度,是否具有统计学意义(p<0.05),并且是否能够很好的与专业知识相吻合。如果无统计学意义,则可以考虑将该路径删除;如果拟合结果不符合专业知识,则需要考虑是否整个模型框架存在较大问题。

1.23 模型修正

根据模型评价的结果对模型进行简化和改进,最终得到一个既符合专业知识,又与数据的特征相吻合,并非常简洁的路径分析模型。显然,一个最终的模型时需要经过多次尝试和修正才能够得到的。

2 案例及其实现

2.1 案例介绍

我们沿用上面介绍的案例。研究“幸福感”的影响因素,有四个变量可能对幸福感有影响,他们分别是:经济水平、受教育程度、身体健康、情感支持。

image.png

2.2 案例操作

image.png

2.3 结果解释

1 模型路径图

image.png

上表展示了带权路径图,主要包括模型的标准化系数,用于分析路径影响关系情况。

2 模型回归系数表

image.png

通过观察p值与标准化系数,确定该路径(X—>Y)是否存在直接的线性影响,如果p<0.05,说明变量之间存在影响关系,可通过标准化路径系数对影响效率量进行深入分析。

可以看出,p值均小于0.05,说明设定的路径均有效。

3 模型拟合指标

image.png

指标说明: ● 卡方和自由 df 度主要用于比较多个模型,卡方值越小越好,自由度反映了模型的复杂程度,模型越简单,自由度越多,反之,模型越复杂,自由度越少。 ● GET(拟合优度指数):主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。其值在 0-1 之间,愈接近 0 表示拟合愈差。CFI≥0.9,认为模型拟合较好。 ● RMSEA(近似误差均方根):一般情况下,RMSEA 在 0.08 以下(越小越好)。 ● RMR(均方根残差):该指标通过测量预测相关和实际观察相关的平均残差,衡量模型的拟合程度。如果 RMR < 0.1,则认为模型拟合较好。 ● CFI(比较拟合指数):该指数在对假设模型和独立模型比较时,其值在 0-1 之间,越接近 0 表示拟合越差,越接近 1 表示拟合越好。一般情况,CFI≥0.9,认为模型拟合较好。 ● NNFI(非规范拟合系数)和 CFI(比较拟合指数) :其值越大越好,所拟合的模型表现较好。

由上表可知,大部分指标都满足要求,说明拟合的模型表现较好。

4 路径节点协方差关系表 ​

image.png

协方差表格分析了模型中没有入度的节点(即没有箭头指向它的节点),用于分析路径节点之间的关联性。如果某项呈现出显著性(p<0.05),且标准化估计系数值较高(越接近于1),则说明相关关系较强,可考虑从模型中加入该路径关系进行分析。

由上表可知,经济水平与受教育程度的协方差关系呈现显著性,标准化系数为-0.236,有极低的关联性。 受教育程度与身体健康水平的协方差关系呈现显著性,标准化系数为 0.26,有较低的关联性。 所以不用考虑从模型中加入该路径关系进行分析。

3 总结

路径分析可以用来反驳一个表明变量之间存在因果关系的模型;但是,它不能用来证明变量之间存在因果关系。

相关推荐

默认标签 数据分析达人
2024年全国大学生数据分析实践赛获奖名单(初稿)公示

# 2024年全国大学生数据分析实践赛获奖名单(初稿)公示 2024年全国大学生数据分析实践赛自2024年8月16日开启,共计吸引了来自

知识竞赛 原创 · 934浏览 · 09-04 08:07
2024数据分析实践赛A、B赛题公布!

**2024数据分析实践赛已于8月16日 18:00正式公布题目!** 完整题目、数据及论文提交格式下载方式: 一、直接通过赛氪网公告下

知识竞赛 原创 · 2784浏览 · 08-16 10:07
实践赛志愿者招募

实践赛志愿者招募

知识竞赛 2024年第三届全国大学生数据分析实践赛组委会 · 1721浏览 · 05-14 06:15
0 条评论
    某人
    可输入 255
    SPSSPRO社区 扫码访问移动端