毕业论文常用相关性分析对比
毕业论文 https://www.spsspro.com/ · 4302浏览 · 2022-03-11 02:32
相关性分析解决解决以下两个问题: 判断两个或多个变量之间的统计学关联; 如果存在关联,进一步分析关联强度和方向

相关性分析

相关性分析解决解决以下两个问题:

判断两个或多个变量之间的统计学关联; 如果存在关联,进一步分析关联强度和方向 下表是汇总整理的常用相关性分析,方便大家找到适合自己数据的分析方法

image.png

定类变量:

无序的:性别(男、女)、血型(A、B、O、AB); 有序的:肥胖等级(重度肥胖,中度肥胖、轻度肥胖、不肥胖)

1 相关分析

对定量变量两两之间的相关程度进行分析,例如人的身高和体重之间;空气中的相对湿度与降雨量之间的相关关系

类型:

Pearson相关系数(适用于定量数据,且数据满足正态分布)

Spearman相关系数(数据不满足正态分布时使用)

Kendall's tau -b相关系数(有序定类变量)

案例:研究人的身高和体重之间的关系

image.png

拿到这样一组数据,想要研究其中的相关关系,首先要做的是正态性检验,如果数据满足正态分布,使用Pearson相关系数,否则使用Spearman相关系数。

image.png

相关性的分析主要是看p值,如果p值小于0.05,则呈现显著性,说明两变量之间存在相关性。

image.png

结果可知,身高体重之间存在相关性。

2 Cochran's Q 检验

用于三个字段以上的二分类定类数据的一致性检验,即相关程度分析。

案例:分析50个同学对一模、二模、三模的三次高考模拟考试的体验,体验分为难或简单,检验三次考试难度是否一样。

image.png

image.png

Cochran's Q 检验主要是看p值,如果p值小于0.05,则呈现显著性,说明两变量之间存在相关性。

image.png

Cochran’s Q检验的结果显示,整体的显著性P值为0.572,水平上不呈现显著性,不能拒绝原假设,因此数据总体不存在差异性,三次考试难度是否一样的。

3 Kappa一致性检验

用于定类数据的相关性检验

一般Kappa系数可用于衡量分类精度,或者投票等定类数。

方法:

简单Kappa:适用于两两纯定类数据(无序)

线性加权Kappa:适用于两两有序定类数据

平方加权Kappa:同线性加权,但加重了有序定类的级别差异

Flesis Kappa:适用于三组以上的定类数据

案例:问卷调查一个班级的两个体育老师对学生体育锻炼的态度(分为:从不、偶尔、经常)划分情况,需要检验是否存在一致性。

image.png

image.png

相关性看p值, <0.05,呈显著性,说明两变量之间存在相关性

Kappa 值的大小代表的相关性解释:

image.png

image.png

显著性 值为0.936,水平上不呈现显著性,不能拒绝原假设,说明总体变量之间不存在一致性。同时,Kappa系数的值为-0.003,因此总体变量的相关性程度为极低的一致性。

4 Kendall协调系数

肯德尔(Kendall)系数用于三组以上定类数据的相关性检验,与此类似的有Kappa系数一致性检验。这两者不同的是:Kappa系数与皮尔逊一样是比较两项之间的相关性;而Kendall系数用于判断总体(全部数据)的相关性,适用于数据是多列相关的等级资料,即可是k个评分者评(N)个对象,也可以是同一个人先后k次评N个对象。通过求得kandall和谐系数,可以较为客观地选择好的作品或好的评分者。

案例:分析 10 个旅游评论家对 5 个景点的打分一致性程度

image.png

image.png

相关性看p值, <0.05,呈显著性,说明两变量之间存在相关性

Kendall值的大小代表的相关性解释与Kappa一致

image.png

Kendall系数一致性检验的结果显示,总体数据的显著性 值为0.745,水平上不呈现显著性,不能拒绝原假设,因此数据不能呈现一致性,同时模型的Kendall协调系数 值为0.049,因此相关性的程度为极低的一致性。

可见五位评委对景点的评分不具有一致性

5 组内相关系数

衡量和评价观察者间信度和复测信度的信度系数指标。通常可以用于问卷调查中评价一个对象对多个样本在一段时间的重测信度,或者判断一批对象对多个样本的一致性检验(定量定类均可)

ICC类型:

Two-way random/mixed absolute agreement:考虑了系统误差(如测量不同评委是否会给予相同选手的相同的打分)

Two-way randomfmixed consistency:不考虑系统误差(如测量不同评委给予相同选手的打分是否高度相关)

One-way random absolute agreement:用于检验每一个选手的均值是否完全相等(如相同评委在不同次数是否会给予相同选手的相同的打分)

案例:5 个评委对于同一批选手进行评分,测量其评分是否一致。或者测量复测信度,比如多次收集某个评委对 100 个参赛选手的评分(或同一批评委的评分平均值),测量其每次评分的相关度是否一致。

image.png

判断方法:

1.选择测量方式,其中单个测量的是基于原始数据,而平均测量是基于原始结果经过均值或者中位数等方式处理;

2.分析组内相关系数对应测量方式的方差分析(P值),方可进行组内相关系数;

3.若方差分析呈现显著性(P<0.05),分析组内相关系数的效应程度,一般认为信度系数低于0.4,表示信度较差,大于0.75表示信度良好,对于定量资料常常需要更高的ICC值;

image.png

针对单个测量的组内相关系数结果显示,显著性 值为 0,水平上呈现显著性,拒绝原假设,说明信度的一致性是可信的。且相关系数为 0.957,说明该数据的信度是很强。

针对平均测量的组内相关系数结果显示,显著性 值为 0,水平上呈现显著性,拒绝原假设,说明信度的一致性是可信的。且相关系数为 0.991,说明该数据的信度是很强。

相关推荐

默认标签 数据分析达人
2025年第四届全国大学生数据分析实践赛

2025全国大学生数据分析实践赛报名须知

知识竞赛 原创 · 7833浏览 · 04-16 08:25
2025年第四届大学生数据分析科普竞赛实施方案

第四届大学生数据分析科普竞赛实施方案

知识竞赛 2025年第四届全国大学生数据分析实践赛组委会 · 6365浏览 · 03-04 09:37
第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!

第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!

知识竞赛 2024年第三届全国大学生数据分析实践赛组委会 · 2253浏览 · 01-07 08:34
0 条评论
    某人
    可输入 255
    SPSSPRO社区 扫码访问移动端