

分层卡方检验,也称为 CMH 检验,主要用于分层或匹配分类数据的分析。比如想要调查某一地区接种疫苗(X) 对感染病毒 (Y) 的影响,由此来判断疫苗的有效性;但考虑到男性、女性体质的不同,疫苗可能会造成不一样的抵抗病毒能力,因此将性别 (Z) 作为混杂因素来进行分析。
SPSSPRO 仅支持 2×2×K 表格的数据结构(即 X 和 Y 均为有 2 个分类水平,k 是指混杂因素 Z 的 k 个水平),通过用分层的思想对混杂因素进行调整,把研究对象分解成不同层次,按各层对象来进行行变量与列变量的独立性研究,以消除由于资料内部的不均一性所造成的偏倚,使资料分析的结果能够更正确地反映所研究变量之间的相关关系,可在去除阶层因素下,更准确地对行列变量的独立性进行研究。
案例:某地区有一项关于是否接种疫苗(X)对于感染病毒 (Y) 风险的影响,将性别 (Z) 作为混杂因素来建立分层卡方检验来进行分析。
软件操作
结果解读
通常情况下,首先查看‘比值比齐性检验’,如果其呈现出显著性(p 值小于 0.05),则说明具有混杂因素,即需要考虑分层项,即分别查看不同分层项下的数据结果(即分层卡方分析结果)。
反之如果没有通过‘比值比齐性检验’,即说明没有混杂因素不需要考虑分层项,报告整体的结果即可(即CMH 条件独立性检验)。
1)数据汇总
2)比值比齐性检验结果
比值比齐性检验的显著性 P 值为 0.970,不存在显著性,说明混杂因素各分类之间同质,并不存在混杂作用,并不需要分别报告混杂因素各分类对应的值(比如 OR 值),而需要整体计算 OR 值,可关注输出结果 4 的 CMH 条件独立性检验结果。
3)分层卡方分析结果
对于分层项-女、男、汇总,建议使用 Pearson 卡方检验,显著性 P 值为 0.000***,水平上呈现显著性,拒绝原假设,因此是否感染病毒和是否接种疫苗数据存在显著性差异。
但是,由于输出结果 2 的证明了混杂因素各分类之间同质,并不存在混杂作用,所以不需要过多地关注该结果。
4)CMH 条件独立性检验
OR 值(Odds Ratio 优势比): ● 若 OR>1,是指分类变量 X1 导致 Y1 发生的概率比 X2 导致 Y1 发生的概率高了(OR-1)%。 ● 若 OR<1,是指分类变量 X1 导致 Y1 发生的概率比 X2 导致 Y1 发生的概率低了(1-OR)%。 ● 若 OR=1,是指分类变量 X1 导致 Y1 发生的概率与 X2 导致 Y1 发生的概率没有差别。
CMH 条件独立性检验的显著性 P 值为 0.000***,存在显著性,说明去除混杂因素影响后,是否感染病毒和是否接种疫苗之间存在显著差异。并且 OR 值为 0.53,可以认为分类变量 X1(已接种疫苗)导致 Y1(感染病毒)发生的概率比 X2(未接种疫苗)导致 Y1(感染病毒)发生的概率低了 47%,这说明接种疫苗是有用的,能减少感染病毒的概率。
相关推荐
第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!