毕业论文之问卷信度效度分析-文章-SPSSPRO社区

信度和效度分析在问卷分析中大多都会用到的，即使是成熟的问卷，一般也是需要做的，在本科和研究生的论文中均适用。信度和效度是用来衡量问卷质量的，如果问卷的信度和效度比较好，证明问卷的数据可靠性比较高，问卷数据内部一致性比较高，所以可以用来做后续的建模分析，相反，如果信度和效度不高，可能就需要重新设计问卷，发放问卷。

调查问卷分为量表题和非量表题。调查问卷数据分析要看有没有量表题，如果有量表题，首先需要进行信度分析和效度分析。非量表题不能进行信度分析和效度分析。

1 量表题和非量表题

1.1 量表题

一般是测试受访者的态度或者看法的题目，是分陈述等级进行设置的。比如我们对手机的喜爱从非常喜欢到不喜欢这个程度的变化。

通常使用李克特量表来测度，根据答项数量可分为四级量表，五级量表，七级量和九级量表。比如五级量表可以分为：非常不满意，比较不满意，中立，满意和非常满意五个选项，通常赋予分值1，2，3，4，5。

1.2 非量表题

分类数据，例如（性别、年龄、学历等）

2 信度分析

2.1 概念

信度分析用于检验问卷中量表样本是否可靠可信。通俗地讲研究样本是否真实回答问题，测试受访者是否好好答题，具体来说就是用问卷对调研对象进行重复测量时，所得结果的一致性程度。

通俗讲，信度就是一次测量很可靠，再测一次，再测10次，结果都是差不多的。

克隆巴赫系数是最常用的信度测量方法

2.2 评判方法

2.21 计算步骤

克隆巴赫系数公式：

该系数值越高，问卷的信度越好，Cronbach’s alpha系数值的范围以及效果如下：

一般来说，Cronbach’s alpha系数大于0.7都是可以接受的。

2.3 案例介绍及操作过程

某公司想了解新出的一款饮品的客户接受情况。于是设计了一份问卷让客户从产品、服务、价格、质量四个方面进行打分，并在每个维度上拓展三到四个问题，以下是收集好的问卷回答，打分方面使用的是李克特 5 级量表。

把数据导入到spsspro中，点击信度分析，将定量数据拖入到变量框中，点击开始分析。

1）Cronbach’s α系数表

模型的Cronbach’s α系数值为0.94，说明该问卷的信度非常好

2）删除分析项统计汇总

通过控制变量法，比较删除某题前后的相关性和Cronbach's α系数等指标，用于辅助判断量表题目是否应该进行修正处理。

首先判断题项删除后总体相关性是否大于0.3，若满足再判断删除题项后的α系数是否小于原系数。若都满足，则可认为该题项情况较好，建议保留题项。

在这里，我们看到相关性均大于 0.3 且删除题项后的α系数均小于原系数，所以不需要对量表题目进行修正处理。

3）信度分析总结图

3 效度分析

3.1 概念

信度没问题后，接下来需要分析的是问卷的效度

效度分析在于研究问卷题目的设计是否合理，即测验能够测到被测量对象的真实水平的程度。

效度比较好代表的是问卷的数据内部一致性比较好，也就是说每个维度的所有题目的选择上基本是一致的，维度划分比较好。

比如说，质量维度的三个题目分别是：饮品的味道、饮品新鲜程度、饮品的品质。对应的选项为5级量表，分别为：1,2,3,4,5代表的是非常不符合、有些不符合、不能确定、有些符合、非常符合。

如果问卷填写人认真填写，那这些题目的选择上应该不会存在太大差异，因为这些题目都是换着方法对同一个问题的问法。

问卷的效度分析是基于主成分因子分析实现的，通过比较题项的因子载荷系数是否在同一主成分表现最优而实现。

3.2 评判方法

KMO值大于0.6（存在相关性），且P<0.05（有显著性），符合因子分析要求累积方差解释率大于50% 题项在对应因子上的因子载荷系数大于0.4 不存在题项与因子对应关系出现严重偏差共同度大于0.4

3.3 操作过程

我们仍旧使用上面的问卷数据，点击问卷分析——效度分析，将定量数据拖入到变量框中，因为我们这份问卷本身设置是有 4 个量表，所以设置因子维度为4个维度，点击开始分析。

1）KMO检验和Bartlett的检验

首先看KMO检验结果，KMO的值为0.908，说明了题项变量之间是存在相关性的；

其次看Bartlett球形检验结果，显著性P值为0.000***<0.05，水平上呈现显著性，因此可以进行因子分析。

2）解释总方差

上表为方差解释表格主要是看因子对于变量解释的贡献率，一般情况下，因子对于变量解释的贡献率在取到变量解释的特征根低于 1 时对应的主成分个数，要表达到 80%以上，否则就要调整因子数据。

方差解释表中，选择主成分个数为 4 个时，变量解释的特征根大于1，累积方差解释率为 0.751，基本可以提取问卷题项信息。

3）碎石图

碎石图的其作用是根据特征值下降的坡度（“坡度趋于平缓“）来确认需要选择的因子主成分个数。

上图我们可以看到特征根在 2 之后趋于平缓，但问卷本身设置是有 4 个量表，故设定因子主成分个数为 4 个。

4）因子载荷系数表

每一个变量都可以用公因子表示，其表达的大小就是公因子方差表中的“提取”，“提取”的值越大说明变量可以被公因子表达的越好，一般大于 0.4 即可以说是可以被表达。

由上图，我们可以看出，产品1-4的因子载荷系数最大值都在因子1，价格1-3的因子载荷系数最大值都在因子2，且载荷系数均大于 0.4，共同度也大于0.4，说明问卷在产品、质量量表上基本合理。

而服务4以及质量1的因子载荷系数最大值与同类型其他几项所在因子不一致，则说明对应关系与预期不符，题项可能存在设计混淆，可以考虑删除或者归为其他类别（服务4归类为价格问题，质量1归类为服务问题）后再检查。

5）因子载荷矩阵热力图

与因子载荷系数表类似，同样是反映每个主成分中隐变量的重要性，颜色越深代表数值越高。

4 信度效度的联系

很多人容易混淆信度跟效度，形象的比喻是：

一个人想要知道自己的心理学水平，测了好几次，每次的结果都不一样，这个叫没信度，即结果不可靠不能重复。

如果用测试教育学水平的试卷测了好几次，分数都是80分，有信度，但是没有效度，因为没有测量到真实的分数。（因为我想测量的是心理学，但是试卷却用成了教育学的）

我现在换成了心理学的试卷测量，每次都是80分，这个就是有信度也有效度。

效度高，证明我这个测验很有效，测的是大家的真实水平。既然是真实水平，那多测几次，得到的结果肯定也是一致的。

因此，效度高，信度也高；信度高，效度不一定高

反之，信度低，效度也低。效度低，信度不一定低。