前言：上文详细的介绍了利用层次分析法来确定权重的方法，但层次分析法的缺点也很明显，即主观性太强，判断矩阵基本上是由个人进行填写，往往最适用于没有数据的情况。

当我们具有数据时，能否直接从数据入手，确定权重呢？

例如上面的题目，常识很难帮助我们确定判断班级整体情况最重要的因素是哪一个，也很难告诉我们其余指标的重要程度如何衡量。倘若没有查到相关资料，那我们真的只能完全主观赋权了。这里都有九个指标了，万一再碰到几十个那种的，单是主观赋权就比较麻烦了……

说了这么多，就可以引出一种完全由数据出发来确定权重的方法——熵权法

1.1 熵权法的原理

熵权法的基本思路是根据指标变异性的大小来确定客观权重

熵权法，物理学名词，按照信息论基本原理的解释，信息是系统有序程度的一个度量，熵是系统无序程度的一个度量；根据信息熵的定义，对于某项指标，可以用熵值来判断某个指标的离散程度，一般来说，若某个指标的信息熵越小，表明指标值得变异程度越大，提供的信息量越多，在综合评价中所能起到的作用也越大，其权重也就越大。如果某项指标的值全部相等，则该指标在综合评价中不起作用。因此，可利用信息熵这个工具，计算出各个指标的权重，为多指标综合评价提供依据。

1.2 熵权法的应用步骤

运用熵权法进行决策时，需要经历以下3个步骤：

1.21 数据标准化

（1）对各个因素按照每个选项的数量进行归一化处理

为避免量纲造成的影响，首先要对指标进行标准化处理。根据指标含义，可将指标分为正向指标（取值越大越好）和逆向指标（取值越小越好），分别通过如下方法进行标准化：

对于正向指标：

对于负向指标：

总而言之，需保证标准化后的数据皆为正数。

1.22 求各指标在各方案下的比值

计算第j项指标下第i个样本所占的比重，并将其看作信息熵计算中用到的概率。

1.23 求各指标的信息熵

根据信息论中信息熵的定义，一组数据的信息熵为：

其中ej≥0。若yij=0，定义ej=0，m 为考虑的影响因素的个数。

1.24 确定各指标的权重

1.25 计算综合评分

2 熵权法应用实例

2.1 背景介绍

某高校在每学年结束会对该年级的11个班级进行考核，考核标准包括成绩、纪律、作风、思想道德、日常管理、班主任工作、素质、违纪行为、迟到早退情况九个方面，并对考核结果较好的班级进行奖励。下表是对各个班级指标考核后的评分结果。

由于各项指标的难易程度不同，因此需要对9项指标进行赋权，以便能够更加合理的对各个班级的整体水平进行评价。前七项指标数值越高表现越好，后两项指标数值越低表现越好。

2.2 数据预处理

11个班级9项指标得分表标准化表：

例如一班的成绩该项指标，我们使用正向指标公式，得

而一班的违纪行为该项指标，我们使用负向指标公式，得

以此类推，可以得到上述结果表。

在该校中，前七项指标属于正向指标，后两项指标属于负向指标（正负项指标由个人定义）

2.3 求各指标在各方案下的比值

例如一班的成绩该项指标，我们使用公式

以此类推，可以得到上述结果表。

2.4 求各指标的信息熵

例如成绩该项指标，我们使用公式

以此类推，可以得到上述结果表。

2.5 计算各指标的权重

例如成绩该项指标，我们使用公式

以此类推，可以得到上述结果表。

2.6 对各个班级进行评分

例如对一班进行评分，我们使用公式

S1=1000.052+900.151+1000.186+840.045+90* 0.072+1000.045+1000.045+500.209+300.195

=72.95

以此类推，可以得到上述结果表。

因此，在十一个班级中，整体情况最好的是6班，其次是3班和2班。

3、案例工具实现

3.1使用工具

3.11 SPSSPRO—>【权重分析（熵权法）】

3.12案例操作

Step1：新建分析；

Step2：上传数据；

Step3：选择对应数据打开后进行预览，确认无误后点击开始分析；

step4：选择【权重分析(熵权法）】；

step5：查看对应的数据数据格式，【权重分析(熵权法）】要求特征序列为类变量，且至少有两项；

step6：点击【开始分析】，完成全部操作

3.13 分析结果解读

以下生成的结果来源于SPSSPRO软件的分析结果导出

输出结果1：权重分析计算结果

熵权法的权重计算结果显示成绩的权重为5.205%、纪律的权重为15.05%、作风的权重为18.637%、思想道德的权重为4.505%、日常管理的权重为7.225%、班主任工作的权重为4.504%、素质的权重为4.541%、违纪行为的权重为20.877%、迟到早退情况的权重为19.456%,其中指标权重最大值为违纪行为(20.877%),最小值为指标班主任工作(4.504%)

输出结果2：指标重要度直方图

上图以直方图形式展示了指标的重要度排序（降序）

在此基础上，我们再使用1.25的公式对各个班级进行评分就更加容易方便。

注：

SPSSPRO 默认会对指标进行正、负向指标处理，通过处理，数据就无需再进一行标准化；熵权法得到权重值后，此时数据与对应的权重相乘，并且进行累加，最终得到一列数据即为‘综合得分’；熵值法的计算公式上会有取对数，因此如果小于等于 0 的数字取对数，则会出现 null 值，SPSSPRO 采用非负平移进行处理，即如果某列（某指标）数据出现小于等于 0，则让该列数据同时加上一个‘平移值’【该值为某列数据最小值的绝对值+0.01】，以便让数据全部都大于 0，因而满足算法要求。

4.结论

熵权法算法简单，是一种客观赋权法，相对主观赋权具有较高的可信度和精确度，能深刻反映出指标的区分能力，进而确定权重权具有较高的可信度和精确度。但同时也具有局限性，它仅凭数据的波动程度，或者说所谓的信息量来获得权重，不考虑数据的实际意义，很可能得出违背常识的结果。所以，当业务经验不会使得权重发生失真，则比较适用于熵权法；反之，若经常发生权重失真的情况，则需要结合专家打分或评判才能较好的发挥熵权法的优势。同时，确定权重前需要确定指标对目标得分的影响方向，对非线性的指标要进行预处理或者剔除。