

频数分析
操作视频
1、作用
频数分析是对一组数据的不同数值的频数,或者数据落入指定区域内的频数进行统计,了解其数据分布状况的方式。通过频数分析,能在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差,并以此证明以后相关问题分析的代表性和可信性。
2、输入输出描述
输入:一个或多个定类变量(单个定类变量不超过 50 个分组)
输出:每个定类变量中不同类别样本的的分布状况与频数统计
3、案例示例
案例:要求校方汇总统计本校学生的性别(男性、女性的个数)与年龄(18 岁及其以下、28~25 岁之间、25 岁以上),进行上报。
4、案例数据
一个定类变量,定类变量指的是当前数值(文本)代表的是一个分类,例如上面的性别(男、女)、年龄(18 岁及其以下、28~25 岁之间、25 岁以上),若输入多个定类变量,则为前面一个定类变量的重复分析。
5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
Step4:选中上传的数据或者之前上传过的数据进入分析页面进行分析;
step5:选择【频数分析】;
step6:查看对应的数据数据格式,【频数分析】要求输入数据为定类变量,且至少有一项;
step7:点击【开始分析】,完成全部操作。
6、输出结果分析
由 4 可知拖入两个定类变量【性别】与【年龄】,这里针对【年龄】定类变量的输出结果进行分析。
输出结果 1:年龄频数分析图
年龄频数分析图
该柱状图展示了对年龄的频数分析的结果,包括分类、频数、百分比等。 输出结果 2:年龄频数分析表格
由年龄频数分析结果显示:分类 3 频数为 6,所占百分比 20.00%;分类 1 频数为 10,所占百分比 33.33%;分类 2 频数为 14,所占百分比 46.667%;其中分类 2 百分比最高,分类 3 的百分比最低。
7、注意事项
SPSSPRO 的频数分析仅支持不超过 50 个分类的定类变量,若超过 50 个分类,会提取降序排序的前 49 个分组,将剩余分组归类到【其他】分组进行输出; 拖入多个定类变量时,产生的频数分析报告为每个定类变量的迭代运算; 如果需要对分类进行重命名,可以到首页-我的数据-变量管理进行标签重命名; 定量变量也可以离散为定类变量,如年龄可以按区间分为少年、青年、中年等、薪资可以按区间分为中产阶级、百万富豪等等,可以通过首页-数据处理-数据编码进行编码。
8、模型理论
频数也称次数,可以反映总体中所有单位在各组间的分布状态和分布特征。频数对总数据按某种标准进行分组,统计出各个组内含个体的个数。而频率则是每个小组的频数与数据总数的比值。在变量分配数列中,频数(频率)表明对应组标志值的作用程度。频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。 一般我们称落在不同小组中的数据个数为该组的频数,频数与总数的比为频率。
9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]彤季. 统计学入门(Ⅺ)[J]数理统计与管理, 1984(05):25-29.
[3]邓明, 王良, 李亮, et al. 中,美影像学期刊发表文章使用的统计学方法和频数差异的分析[J]. 中华放射学杂志, 2014, 48(009):772-776.
相关推荐
第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!