信度和效度分析在问卷分析中大多都会用到的,即使是成熟的问卷,一般也是需要做的,在本科和研究生的论文中均适用。信度和效度是用来衡量问卷质量的,如果问卷的信度和效度比较好,证明问卷的数据可靠性比较高,问卷数据内部一致性比较高,所以可以用来做后续的建模分析,相反,如果信度和效度不高,可能就需要重新设计问卷,发放问卷。
调查问卷分为量表题和非量表题。调查问卷数据分析要看有没有量表题,如果有量表题,首先需要进行信度分析和效度分析。非量表题不能进行信度分析和效度分析。
1 量表题和非量表题
1.1 量表题
一般是测试受访者的态度或者看法的题目,是分陈述等级进行设置的。比如我们对手机的喜爱从非常喜欢到不喜欢这个程度的变化。
通常使用李克特量表来测度,根据答项数量可分为四级量表,五级量表,七级量和九级量表。比如五级量表可以分为:非常不满意,比较不满意,中立,满意和非常满意五个选项,通常赋予分值1,2,3,4,5。
1.2 非量表题
分类数据,例如(性别、年龄、学历等)
2 信度分析
2.1 概念
信度分析用于检验问卷中量表样本是否可靠可信。通俗地讲研究样本是否真实回答问题,测试受访者是否好好答题,具体来说就是用问卷对调研对象进行重复测量时,所得结果的一致性程度。
通俗讲,信度就是一次测量很可靠,再测一次,再测10次,结果都是差不多的。
克隆巴赫系数是最常用的信度测量方法
2.2 评判方法
2.21 计算步骤
克隆巴赫系数公式:
该系数值越高,问卷的信度越好,Cronbach’s alpha系数值的范围以及效果如下:
一般来说,Cronbach’s alpha系数大于0.7都是可以接受的。
2.3 案例介绍及操作过程
某公司想了解新出的一款饮品的客户接受情况。于是设计了一份问卷让客户从产品、服务、价格、质量四个方面进行打分,并在每个维度上拓展三到四个问题,以下是收集好的问卷回答,打分方面使用的是李克特 5 级量表。
把数据导入到spsspro中,点击信度分析,将定量数据拖入到变量框中,点击开始分析。
1)Cronbach’s α系数表
模型的Cronbach’s α系数值为0.94,说明该问卷的信度非常好
2)删除分析项统计汇总
通过控制变量法,比较删除某题前后的相关性和Cronbach's α系数等指标,用于辅助判断量表题目是否应该进行修正处理。
首先判断题项删除后总体相关性是否大于0.3,若满足再判断删除题项后的α系数是否小于原系数。若都满足,则可认为该题项情况较好,建议保留题项。
在这里,我们看到相关性均大于 0.3 且删除题项后的α系数均小于原系数,所以不需要对量表题目进行修正处理。
3)信度分析总结图
3 效度分析
3.1 概念
信度没问题后,接下来需要分析的是问卷的效度
效度分析在于研究问卷题目的设计是否合理,即测验能够测到被测量对象的真实水平的程度。
效度比较好代表的是问卷的数据内部一致性比较好,也就是说每个维度的所有题目的选择上基本是一致的,维度划分比较好。
比如说,质量维度的三个题目分别是:饮品的味道、饮品新鲜程度、饮品的品质。对应的选项为5级量表,分别为:1,2,3,4,5代表的是 非常不符合、有些不符合、不能确定、有些符合、非常符合。
如果问卷填写人认真填写,那这些题目的选择上应该不会存在太大差异,因为这些题目都是换着方法对同一个问题的问法。
问卷的效度分析是基于主成分因子分析实现的,通过比较题项的因子载荷系数是否在同一主成分表现最优而实现。
3.2 评判方法
KMO值大于0.6(存在相关性),且P<0.05(有显著性),符合因子分析要求 累积方差解释率大于50% 题项在对应因子上的因子载荷系数大于0.4 不存在题项与因子对应关系出现严重偏差 共同度大于0.4
3.3 操作过程
我们仍旧使用上面的问卷数据,点击问卷分析——效度分析,将定量数据拖入到变量框中,因为我们这份问卷本身设置是有 4 个量表,所以设置因子维度为4个维度,点击开始分析。
1)KMO检验和Bartlett的检验
首先看KMO检验结果,KMO的值为0.908,说明了题项变量之间是存在相关性的;
其次看Bartlett球形检验结果,显著性P值为0.000***<0.05,水平上呈现显著性,因此可以进行因子分析。
2)解释总方差
上表为方差解释表格主要是看因子对于变量解释的贡献率,一般情况下,因子对于变量解释的贡献率在取到变量解释的特征根低于 1 时对应的主成分个数,要表达到 80%以上,否则就要调整因子数据。
方差解释表中,选择主成分个数为 4 个时,变量解释的特征根大于1,累积方差解释率为 0.751,基本可以提取问卷题项信息。
3) 碎石图
碎石图的其作用是根据特征值下降的坡度(“坡度趋于平缓“)来确认需要选择的因子主成分个数。
上图我们可以看到特征根在 2 之后趋于平缓,但问卷本身设置是有 4 个量表,故设定因子主成分个数为 4 个。
4)因子载荷系数表
每一个变量都可以用公因子表示,其表达的大小就是公因子方差表中的“提取”,“提取”的值越大说明变量可以被公因子表达的越好,一般大于 0.4 即可以说是可以被表达。
由上图,我们可以看出,产品1-4的因子载荷系数最大值都在因子1,价格1-3的因子载荷系数最大值都在因子2,且载荷系数均大于 0.4,共同度也大于0.4,说明问卷在产品、质量量表上基本合理。
而服务4以及质量1的因子载荷系数最大值与同类型其他几项所在因子不一致,则说明对应关系与预期不符,题项可能存在设计混淆,可以考虑删除或者归为其他类别(服务4归类为价格问题,质量1归类为服务问题)后再检查。
5)因子载荷矩阵热力图
与因子载荷系数表类似,同样是反映每个主成分中隐变量的重要性,颜色越深代表数值越高。
4 信度效度的联系
很多人容易混淆信度跟效度,形象的比喻是:
一个人想要知道自己的心理学水平,测了好几次,每次的结果都不一样,这个叫没信度,即结果不可靠不能重复。
如果用测试教育学水平的试卷测了好几次,分数都是80分,有信度,但是没有效度,因为没有测量到真实的分数。(因为我想测量的是心理学,但是试卷却用成了教育学的)
我现在换成了心理学的试卷测量,每次都是80分,这个就是有信度也有效度。
效度高,证明我这个测验很有效,测的是大家的真实水平。既然是真实水平,那多测几次,得到的结果肯定也是一致的。
因此,效度高,信度也高;信度高,效度不一定高
反之,信度低,效度也低。效度低,信度不一定低。
相关推荐
# 2024年全国大学生数据分析实践赛获奖名单(初稿)公示 2024年全国大学生数据分析实践赛自2024年8月16日开启,共计吸引了来自
**2024数据分析实践赛已于8月16日 18:00正式公布题目!** 完整题目、数据及论文提交格式下载方式: 一、直接通过赛氪网公告下