

1 基本概述
1.1 简介
均值比较的假设检验是数据分析最重要的分析内容之一,根据参与比较的样本数量不同,使用的假设检验方法也不同。方差分析的结果只能检验出三个以上的总体均值完全相同或不完全相同。当不完全相同时,至于是哪个或哪些总体均值与其它总体均值不同则是不能获知的。
因此方差分析结束以后还需要做事后多重检验,分析出到底是哪个或哪些变量均值之间存在差异。
1.2 方差分析后进行事后多重比较而不直接用独立样本T检验进行多次两两比较的原因
我们以方差分析为例,假如有5个样本,若使用多次两两比较,则比较的次数多达10次。设每次比较的显著性水平等于0.05,那么10次比较都不犯“弃真”错误的概率为(1-0.05)的十次方,为0.59左右,即犯“弃真”错误的概率高达0.40左右,这远远大于原先设定的显著性水平0.05。随着比较组数的增多,犯“弃真”错误的概率将会越来越大。
1.3 多重检验的方法
根据不同的目的和数据情况,学者们提出了很多不同的方法,主要有以下两大类:
1.31 两两比较的方法
1)LSD法
最小显著性差异法,是最简单的比较方法之一。它是t检验的一个简单变形,并未对检验水准做出任何校正,只是在标准误(注意不是标准差)的计算上充分考虑了所有总体水平的样本信息,估计出了一个更为稳健的标准误。
2)Sidak法
Sidak校正在LSD法上的应用。通过Sidak校正降低每次两两比较的“弃真”错误概率,以使最终整个比较的“弃真”错误概率保持为显著性水平a。这也就是说每次比较的显著性水平a会随着比较次数的增多而减小。显然,Sidak法比LSD法的灵敏度低。
每次进行Sidak比较的显著性水平为:
,a表示事先设定的显著性水平,k表示两两比较的次数。
3)Bonferroni法
与Sidak法类似,它的每一次比较实际上是Bonferroni校正在LSD法上的应用。Bonferroni法修正后每次比较的显著性水平比Sidak法的更小,也就是说Bonferroni法比Sidak法的灵敏度更低。
,a表示事先设定的显著性水平,k表示两两比较的次数。
4)Scheffe法
Scheffe法的实质是对多个总体均值间的线性组合是否为0进行假设检验。多用在两组样本含量不同的情况。
以上方法的排列顺序是按照灵敏度从高到低排列为:LSD法>Sidak法>Bonferroni法>Scheffe法
1.32 形成同质亚组的方法
1)SNK法
全称为Student-Newman-Keuls法。它实质上是根据预先指定的准则将各组均值分为多个亚组,利用Studentized Range分布来进行假设检验,并根据所要检验的均值个数调整总的“弃真”错误概率不超过设定的显著性水平a。
2)Tukey法
全称为Tukey' s Honestly Significant Difference法。应用这种方法要求各组样本含量相同。它也是利用Studentized Range分布来进行各组均数间的比较,与SNK法不同地是,它控制所有比较中最大的“弃真”错误概率不超过设定的显著性水平a。
以上6种是常用的事后多重检验方法,SPSSPRO都有提供,剩下的方法并不常用,这里就不在介绍。
2 案例介绍
分析个人受教育程度(定类变量)是否给个人的经济收入(定量变量)带来显著性影响。
3 软件操作及结果解读
3.1 软件操作
输入:一个定类变量(如受教育程度)与一个或多个定量变量(如工资、家庭年收入)。
输出:方差分析结果:同一因素不同分组对定量变量产生/不产生显著性影响;事后多重比较结果:哪两类之间存在差异性。
3.2 结果解读
1)方差分析结果
方差分析的结果显示,对于变量月收入,显著性P值为0.000***,水平上呈现显著性,拒绝原假设,说明变量月收入在学历之间存在显著性差异,需要进行事后多重比较。
2)方差分析对比图
上图展示了方差分析的均值的结果,通过比较均值,可以挖掘其差异关系,一般结合输出结果三共同分析。
3)事后多重比较结果
使用LSD方法的事后多重比较的结果显示: 对于变量月收入,均值大小排序为:大学>高中>初中>无。其中初中与大学、初中与高中、大学与无、大学与高中存在显著性差异。
注意事项
- 如果输入的定类变量仅两类,则一般不进行事后多重比较;
- 如果方差分析的结果P值大于0.05,说明各类之间没有差异性,则不需要进行事后多重比较;
- 尽量在方差齐性时进行方差分析甚至两两比较
相关推荐