分类汇总
1、作用
根据定类变量分类进行汇总(按照某一标准进行分类,然后在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等方法的汇总。又名列联表分析)
2、输入输出描述
输入:分组项为一个或多个定类变量,汇总项为一个或多个定类变量
输出:在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等统计量
3、案例示例
统计公司最近 2 个月的办公设备采购情况,分别按照设备类型、数量、采购金额进行汇总分析。
4、案例数据
分类汇总案例数据
5、案例操作
分类汇总上传数据
Step1:新建项目;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
Step4:选中上传的数据或者之前上传过的数据进入分析页面进行分析; 分类汇总操作
step5:选择【分类汇总】;
step6:查看对应的数据数据格式,【分类汇总】分组项要求输入数据为定类变量,且至少有一项;
step7:查看对应的数据数据格式,【分类汇总】汇总项要求输入数据为定量变量,且至少有一项;
step8:点击【开始分析】,完成全部操作。
6、输出结果分析
输出结果 1:分组汇总图
图表说明: 上图展示了汇总变量:数量分类汇总的结果,可以计算样本量、最大值、最小值等统计量,用于研究分组后定量数据的整体情况。
输出结果 2:分组汇总表
图表说明: 上表展示了汇总变量:数量、采购金额分类汇总的结果,可以计算样本量、最大值、最小值等统计量,用于研究分组后定量数据的整体情况。
7、注意事项
定类变量的分类汇总只有频数是有意义的
8、模型理论
对所有资料分类进行汇总。(把资料进行数据化后,先按照某一标准进行分类,然后在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等方法的汇总。)
均值:平均数,统计学术语,是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。它是反映数据集中趋势的一项指标。解答平均数应用题的关键在于确定“总数量”以及和总数量对应的总份数。
计数:计数是一个重复加(或减)1 的数学行为,通常用于算出对象有多少个或放置想要之数目个对象(对第一个对象从一算起且将剩下的对象和由二开始的自然数做一对一对应)。
中位数:中位数(Median)又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
标准差:标准差(Standard Deviation) ,是离均差平方的算术平均数(即:方差)的算术平方根,用 σ 表示。标准差也被称为标准偏差,或者实验标准差,在概率统计中最常使用作为统计分布程度上的测量依据。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
最大值:即为已知的数据中的最大的一个值
最小值:即为已知的数据中的最小的一个值
众数:众数(Mode)是指在统计分布上具有明显集中趋势点的数值,代表数据的一般水平。 也是一组数据中出现次数最多的数值,有时众数在一组数中有好几个。用 M 表示。
求和:两个及两个以上数值相加所获得的总数
9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com. [2]杨长城. 浅谈对数学语言的认识[J]. 基础教育, 2008, 000(003):32-33. [3]刘悦,郝舒欣,宋杰,周连,刘婕,王秋水,袁大勇,徐东群. 空气污染与疾病关系的时间序列分析中门急诊数据快速清洗及自动分类汇总方法的研究[J]. 卫生研究(4 期):109-115.
相关推荐
# 2024年全国大学生数据分析实践赛获奖名单(初稿)公示 2024年全国大学生数据分析实践赛自2024年8月16日开启,共计吸引了来自
**2024数据分析实践赛已于8月16日 18:00正式公布题目!** 完整题目、数据及论文提交格式下载方式: 一、直接通过赛氪网公告下
本文阐述了峰度与偏度在统计学中的意义,及其对管理决策的影响。峰度反映数据分布尖锐度,偏度衡量对称性。理解两者有助于风险评估、市场预测和策略规划,促进更精准的决策,增强管理效能。通过有效利用这些统计概念,管理者能提升数据分析技能,优化决策流程。