一、数据处理类:
1、如何把李克特5级量表的选择题,合并成一个数据进行分析?
可以把每一个维度内的量表计算平均值,使用 数据处理--生成变量
2、反向计分题目需要做处理么?
需要的,具体在数据处理——数据编码,比如原来是1,2,3,4,5,改成5,4,3,2,1就好了
3、在进行多选题录入时,是一个选项一个题吗,而且录入时数据编码是自己一个一个照应输的吗?
多选题有n个选项,就处理成n个变量,且为二分类定类变量,需要注意的是,这里的二分类只能是 0,1,并且 1 代表选中。
4、对数据编码后还是原来的数据,没有变化?
在数据处理中进行编码操作后会生成新的变量,原来的数据依然保留。
5、数据处理如何找回历史版本?
我的数据——找到文件——查看版本
6、SPSSPRO机器学习分类准确率和召回率一模一样,怎么回事?
https://zhuanlan.zhihu.com/p/564934165
二、问卷分析类:
1、如何将不同类别的多选题做一个对比图,例如不同年龄段的喜好(多选题)进行对比?
利用交叉分析【单选&多选】
2、做综合评价模型需要先对数据进行正向化和标准化后再导入吗?
TOPSIS、RSR、耦合协调度、熵权法、熵值法、多准则妥协解排序法(VIKOR)这几个系统做了标准化处理,其他算法模型上传后为原始数据。
3、因子分析里结果只有综合得分和原始指标的得分,没有各个公因子得分吗?
系统没有自动计算出来,但是在输出结果7:成分矩阵表 有各个因子的计算公式,需要的话可以自行计算
4、一个问卷中既有选择题,又有排序题,如何进行信效度分析?
信效度分析只针对表示程度的量表题,不用拖入排序题等其他题型
5、逻辑回归自变量分析了三个选择题,为什么每一个选择题都少了一个选项,系统说的是数据缺失?
逻辑回归中对于分类自变量,算法会对它进行哑变量化,具有n个分类水平的分类变量,会转化为n-1个哑变量。
举一个例子,假设变量“上班交通工具”的取值分别为:公交、地铁、私家车、自行车、电动车,5种选项,我们可以转化4个哑变量来代替“交通工具”这个变量,分别为D1(1=公交/0=非公交)、D2(1=地铁/0=非地铁)、D3(1=私家车/0=非私家车)、D4(1=自行车/0=非自行车),最后一个选项“电动车”的信息已经包含在这4个变量中了,即当(非公交、非地铁、非私家车、非自行车)的情况,那么只可能是电动车,所以不需要再增加一个D5(1=电动车/0=非电动车)了
这就是一个分类自变量转成(n-1)个哑变量的过程
所以在分析时,只会显示这(n-1)选项。
6、结构方程模型标准载荷系数为1.26有问题吗,是不是违规估计了?
当变量之间出现共线性问题的时候,此时标准化载荷系数值会大于1。
7、请问探索性因子分析和验证性因子分析,是分析自变量还是因变量呢?
因子分析的基本思想是寻找公共因子以达到降维的目的。 可以放在一起做,由于只有一个因变量,可以只做自变量。有多个因变量就可以分开自变量、因变量做两次。
8、数据包络分析很久不出结果?
数据包络他是一个规划求解,求解起来是非常久的,这个算法数据量越大,跑的越慢,一般建议数据最好不要超过200。如果数据非常多,建议采用抽样,抽取一部分演示就行了,他跟整体没什么关系,都是独立样本的
9、用皮尔逊做完相关性分析后,还有其它分析方法来验证一下相关性吗?
相关分析一般常用四种方法: - 1 画图判断(一般会初步通过散点图来直观看线性关系) - 2 pearson(皮尔逊)相关系数 - 3 sperman(斯皮尔曼)相关系数 - 4 Kendall's tau-b等级相关系数
三、机器学习类:
1、为什么XXXX多组数据进行时序和XGboost之后只剩下xx多组了呢?
那个只是预测结果,要看全部数据就要在这里把原始处理数据上传上去
2、请问分类算法的训练集和测试集的比例是?如何划分数据集算出准确率、召回率、精确度等指标?
机器学习一系列算法里面的训练集测试集划分比例是可以自行调节的。拖入数据进行拟合,SPSSPRO会自动分别计训练集、测试集的算准确率、召回率、精确度。
3、spsspro 机器学习回归向后预测结果老是和最后一个结果数值一样?
这是正常现象,预测数据滞后于真实数据几乎是多步时间序列预测中必然会面临的挑战。
有些人会这样解决:
1、把前几期数据的平均数等统计量作为自变量(特征)加入到模型中,让模型去学习更多的特征。
2、进行多步预测,输出多步输出结果,从而取预测时点的综合结果
四、notebook类:
直接pip install 安装成功但是import失败或者提示需要更新问题。
模板库——系统代码——常用python库安装里有安装包的模板
相关推荐
第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!
# 2024年全国大学生数据分析实践赛获奖名单(初稿)公示 2024年全国大学生数据分析实践赛自2024年8月16日开启,共计吸引了来自
**2024数据分析实践赛已于8月16日 18:00正式公布题目!** 完整题目、数据及论文提交格式下载方式: 一、直接通过赛氪网公告下