数据包络分析(DEA)简单实现
案例库 https://www.spsspro.com/ · 5429浏览 · 2022-06-16 06:19
-

1 基本概念

1.1 定义

数据包络分析是运筹学中用于测量决策部门生产效率的一种方法,它是评价多输入指标和多输出指标的较为有效的方法,将多投入与多产出进行比较,得到效率分析,可广泛使用于业绩评价。

详细来说,通过使用数学规划模型,计算决策单元相对效率,从而评价各个决策单元。每个决策单元(DMU)都可以看作为相同的实体,各 DMU 有相同的输入、输出。综合分析输入、输出数据,DEA 可得出各个 DMU 的综合效率,据此定级排队 DMU,确定有效(即相对效率最高)DMU,挖掘其他 DMU非有效的程度和缘由。

1.2 特点

  • 适合用于多输出-多输入的有效性综合评价问题,在处理所输出-多输入的有效性评价方面具有绝对优势
  • 应用DEA方法建立模型前无需对数据进行量纲化处理
  • 无需任何权重假设

1.3 名词解释

1、技术效率:指在保持决策单元投入不变的情况下,实际产出同理想产出的比值。

2、规模报酬:规模报酬是要说明,当生产要素同时增加了一倍,如果产量的增加正好是一倍,称之为规模报酬不变(-),如果产量增加多于一倍,则称之为规模报酬递增(irs),进而,如果产量增加少于一倍,就称为规模报酬递减(drs)。

3、决策单元(DMU)就是效率评价的对象,可以理解为一个将一定“投入”转化为一定“产出”的实体。此文中,DMU就是每个楼盘。

4、DEA强有效:任何一项投入的数量都无法减少,除非减少产出的数量或者增加其他至少一种投入的数量;任何一项产出的数量都无法增加,除非增加投入的数量或减少其他至少一种产出的数量。

5、DEA弱有效:无法等比例减少各项投入的数量,除非减少产出的数量;无法等比例增加各项产出的数量,除非增加投入的数量。这种情况下,虽然不能等比例减少投入或增加产出,但某一项或几项(但不是全部)投入可能减少,所以称为弱有效。

6、生产前沿面:(自己通俗的理解)对于给定的生产要素和产出价格,选择要素投入的最优组合和产出的最优组合,即投入成本最小、产出收益最大的组合。它所对应的生产函数所描述的生产可能性边界就是生产前沿面。

1.4 类型介绍

DEA 模型具体又可细分为三种类型:

CCR 模型:该模型假定规模报酬不变,主要用来测量技术效率;

指对DMU通过“投入一定数量的生产要素,并产出一定数量的产品”的经济系统来判断各个单元的相对合理性和有效性。从投入资源的角度来看,在当前产出的水准下,比较投入资源的使用情况,以此作为效益评价的依据,这种模式称为“投入导向模式”。

BCC 模型:该模型假定规模报酬可变,主要测算纯技术效率,即技术效率与规模效率的比值;

从产出的角度探讨效率,即在相同的投入水准下,比较产出资源的达成情况,这种模式称为“投入导向模式”。所得到的是“技术效益”,DEA=1称为“技术有效”,最优解是决策单元j的“技术效益”。

DEA-Malmquist 指数模型:该模型可以测算出决策单元 (DMUs) 的生产效率在不同时期的动态变化情况。

DEA 模型有多种类型,最具代表性有CCR 模型,BCC模型。CCR 模型基于规模报酬不变的假设,而BCC模型则基于规模报酬可变的假设,二者各有侧重,可以选择结合两个方法同时展开数据分析(一般较多采用 BBC 模型)。

2 案例简介

在实际使用中,首先搭建模型确认相应的投入指标、产出指标。

投入变量为:政府财政收入占 GDP 的比例、环保投资占 GDP 的比例、每千人科技人员数/人。

产出变量为:人均 GDP、城市环境质量指数。

试分析投入产出效率,得出如何调整投入变量和产出变量,才能达到最优效率。

image.png

3 软件操作

3.1 操作步骤

image.png

Step1:新建分析;

Step2:上传数据;

Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

image.png

step4:选择【数据包络分析】;

step5:查看对应的数据数据格式,【数据包络分析】要求先放入投入指标(>=1 的定量变量),再放入产出指标(>=1 的定量变量),最后放入索引项(<=1 的定类变量)。

step6:设置 DEA 类型(规模报酬不变(CCR)or 规模报酬可变(BBC)),例子中选择规模报酬可变模型(BBC)。

step7:点击【开始分析】,完成全部操作。

3.2 结果解读

1)效益分析表

image.png

图表说明: CCR 模型只有综合效益,而在 BCC 模型(VRS)会将综合效益分解为技术效益和规模效益。

效益 S 的意义:

● 综合技术效益反映的是决策单元在最优规模时投入要素的生产效率,是对决策单元的资源配置能力、资源使用效率等多方面能力的综合衡量与评价,值等于 1 时,代表该决策单元的投入与产出结构合理,相对效益最优;

● 技术效益反映的是由于管理和技术等因素影响的生产效率,其值等于 1 时,代表投入要素得到了充分利用,在给定投入组合的情况下,实现了产出最大化;

● 规模效益反映的是由于规模因素影响的生产效率,其值等于 1 时,代表规模效率有效(规模报酬不变),也就是规模适宜,已达到最优的状态;

松弛变量的意义:

松驰变量 S-指为达到目标效率可以减少的投入量,增加这些投入量就能达到更高的效率;

松驰变量 S+指为达到目标效率可以增加的产出量,减少这些投入量就能达到更高的效率;

有效性的意义:

有效性分析结合综合效益指标,S-和 S+共 3 个指标,可判断 DEA 有效性:

● 如果综合效益=1 且 S-与 S+均为 0,则‘DEA 强有效’;

● 如果综合效益为 1 但 S-或 S+大于 0,则‘DEA 弱有效’;

● 如果综合效益<1 则为‘非 DEA 有效’。

分析:

由上表可知,其中城市 2,8,9,10 达到了 DEA 强有效(松弛变量均为 0),这说明达到了资源充分利用,是一种帕累托最优的状态。

其余决策单元非 DEA 有效,需要减少投入或者增加产出,怎么改变产出需要具体见后面的投入冗余分析和产出不足分析。 规模效益分析可以见后续的结果——规模报酬分析

2)效益有效性分析

image.png

图表说明:上图展示了效益分析图。其中 X 轴代表决策单元,Y 轴代表效益值。

分析:该图是上述有效性的可视化图,主要用于分析各个决策单元的有效性情况,寻找效益最低的决策单元,可见大部分城市是规模效益不足,少部分为技术效益不足。

3)规模报酬分析

image.png

图表说明:

● 在不同的生产规模下,规模报酬将会随之改变:

● 规模报酬系数<1 时;生产规模较小,投入产出比会随着规模增加而迅速提升,称为规模报酬递增(IRS)(规模过小可扩大规模增加效益);

● 规模报酬系数=1 时,生产达到高峰期,产出与投入成正比而达到最适生产规模,称为规模报酬固定;

● 规模报酬系数>1 时;生产规模过于庞大,导致产出减缓,则称为规模报酬递减(DRS),也就是投入增加时,产出增加的比例会少于投入增加的比例(规模过大可减少规模增加效益)。

分析:由表可知,城市 1,4,5,6,7 需要提升规模以提高效率,城市 3 需要降低规模以提高效率,城市 2,8,9,10 达到了最优效率可以认为暂不需要变动。

4)象限分析

image.png

图表说明:投入产出象限图利用 PCA 降维方式把投入、产出指标进行单维化,进而通过象限图的方式呈现决策单元的空间分布,以下为各个象限的意义:

第一象限:高投入,高产出。

第二象限:低投入,高产出。

第三象限:低投入,低产出。

第四象限:高投入,低产出。

5)象限分析输出汇总

image.png

图表说明:

上表展示了象限分析的部分/全部的象限分布。

6)投入冗余分析

image.png

图表说明:

投入冗余分析(差额变数分析)主要用于分析各变量需要减少多少投入时才能达目标效率。

● 松驰变量 S-(差额变数)指为达到目标效率需要减少的投入量;

● 投入冗余率指‘过多投入’与已投入的比值,该值越大意味着‘过多投入’越多;

分析:从上表可知,在城市 5,6 中政府财政收入占 GDP 的比例的量分别冗余了 0.037 个单位和 0.047 个单位,占该城市这个量的 15.2%和 20.6%,政府需要减少财政收入或者增加其他财政收入的方式。

城市 4、5、7 中环保投资占 GDP 的比例分别冗余了 0.003 个单位、0.003 个单位和 0.007 个单位,占该城市这个量的 5.0%、6.9%和 12.4%,政府需要减少环保投资占 GDP 的比例。

城市 6 中每千人科技人员数冗余了 25.509 个单位,占该城市这个量的 14.4%,说明在城市 6 中每千人中可以减少约 25.509 个单位的科技人员数。

7)产出不足分析

image.png

图表说明:

产出不足分析(超额变数分析)主要用于分析各变量需要增加多少产出时达目标效率。

● 松驰变量 S-(超额变数)指为达到目标效率可以增加的产出量;

● 产品不足率指‘产出不足’与已产出的比值,该值越大意味着‘产出不足’越多;

分析:从上表可知,在城市 3,5 中人均 GDP 需要增加 23432.000 个单位和 6794.00 个单位,占该城市人均 GDP 的 21.3%和 6.7%,政府需要想办法增加这些城市的人均 GDP。 各城市的环保指数都达到了最优产出。

注: - 数据包络分析容易收到极值的影响,需要谨慎选择指标。 - 数据包络分析存在负向指标时,需要使用 SPSSPRO 的数据处理功能将指标正向化。 - 数据包络分析(EDA)并不直接对数据进行综合,因此决策单元指标与量纲选取无关,故无需进行无量纲化处理。 - 评估结果是相对效率而非绝对效率,因此效率为 1 只能说明在当前资源下不同方案同等有效,并不代表没有改进之处。 - 数据包络分析不依赖于权重的选择,将所有的投入、产出资源认为同等重要,一定程度上会损失模型的可靠性

4 总结

4.1 DEA有效的经济意义

数据包络分析DEA的本质是利用统计数据确定相对有效的生产前沿面,利用生产前沿面的理论和方法,建立非参数的最优化模型,研究相同类型部门间的效率差异。

根据DEA的原理,DEA有效的DMU在每个投入指标和每个产出指标乘以一个加权系数后,其产出加权和投入加权和之比是最大的,因为所有的其他DMU用样的加权系数算出这一比值都不会超过1。

4.2 DEA效率值的经济意义

技术效率值(TE)TE可分解得到纯技术效率值(PTE)和规模效率值(SE,SE=TE/PTE)。

三者的经济意义分别为:TE是对决策单元综合效率的衡量;PTE是对决策单元配置资源效率的衡量;SE是对决策单元投入资源规模效率的衡量。

4.3 AHP与DEA的结合

AHP法的判断矩阵是有评价者或专家给定的,因此其一致性必然受到有关人员的知识结构、判断水平及个人偏好等诸多主观因素的影响。

DEA各决策单元的输入输出数据指标的权重为变量,使各指标的权重不受主观因素的影响。

结合二者的权重可以得到加权综合权重,两者结合避免了仅仅采用DEA方法会导致的指标选取的人为性和随意性。

相关推荐

默认标签 数据分析达人
2024年全国大学生数据分析实践赛获奖名单(初稿)公示

# 2024年全国大学生数据分析实践赛获奖名单(初稿)公示 2024年全国大学生数据分析实践赛自2024年8月16日开启,共计吸引了来自

知识竞赛 原创 · 1317浏览 · 09-04 08:07
2024数据分析实践赛A、B赛题公布!

**2024数据分析实践赛已于8月16日 18:00正式公布题目!** 完整题目、数据及论文提交格式下载方式: 一、直接通过赛氪网公告下

知识竞赛 原创 · 3513浏览 · 08-16 10:07
深入理解标准正态分布的峰度与偏度

本文阐述了峰度与偏度在统计学中的意义,及其对管理决策的影响。峰度反映数据分布尖锐度,偏度衡量对称性。理解两者有助于风险评估、市场预测和策略规划,促进更精准的决策,增强管理效能。通过有效利用这些统计概念,管理者能提升数据分析技能,优化决策流程。

其他 原创 · 1419浏览 · 07-08 04:40
0 条评论
    某人
    可输入 255
    SPSSPRO社区 扫码访问移动端