数据包络分析DEA(数学建模)

一、模型背景

数据包络分析是线性规划模型的应用之一,常被用来衡量拥有相同目标的运营单位的相对效率。
数据包络分析是一种基于线性规划的用于评价同类型组织(或项目)工作绩效相对有效性的特殊工具手段。这类组织例如学校、医院、银行的分支机构、超市的各个营业部等,各自具有相同(或相近)的投入和相同的产出。衡量这类组织之间的绩效高低,通常采用投入产出比这个指标,当各自的投入产出均可折算成同一单位计量时,容易计算出各自的投入产出比并按其大小进行绩效排序。
但当被衡量的同类型组织有多项投入和多项产出,且不能折算成统一单位时,就无法算出投入产出比的数值。例如,大部分机构的运营单位有多种投入要素,如员工规模、工资数目、运作时间和广告投入,同时也有多种产出要素,如利润、市场份额和成长率。在这些情况下,很难让经理或董事会知道,当输入量转换为输出量时,哪个运营单位效率高,哪个单位效率低。
因而,需采用一种全新的方法进行绩效比较。这种方法就是二十世纪七十年代末产生的数据包络分析((DEA )。DEA方法处理多输入,特别是多输出的问题的能力是具有绝对优势的。
DEA模型是直接使用输入、输出数据建立非参数的经济数学模型。
DEA特别适用于具有多输入多输出的复杂系统,这主要体现在以下几点:
DEA以决策单位各输入/输出的权重为变量,从最有利于决策单元的角度进行评价,从而避免了确定各指标在优先意义下的权重;
假定每个输入都关联到一个或者多个输出,而且输入/输出之间确实存在某种关系,使用DEA方法则不必确定这种关系的显示表达式。

二、模型介绍

1、评价思想

核心是通过对每个DMU的输入和输出数据进行综合分析,得出每个DMU效率的相对指标,然后将所有DMU效率指标排序,确定相对有效的DMU即有效的决策单元,为管理人员提供管理决策信息
举个例子,每个公司的各个部门可以看成是每个DMU,因为每个部门有输入成本和产出效益

2、DEA基本概念

在DEA中一般称被衡量绩效的组织为决策单元( decision makingunit—DMU )。

设:n个决策单元( j=1,2,...,n )
每个决策单元有相同的m项投入(输入)(i =1 ,2,m )
每个决策单元有相同的s项产出(输出)(r=1,2,s )
Xij——第j决策单元的第i项投入
yrj——第j决策单元的第r项产出衡量第j0决策单元是否DEA有效

3、结果

①θ=1,DEA有效,表示投入与产出比达到最优
②θ<1,非DEA有效,表示投入与产出比没有达到最优,一般来说,θ越大说明效果越好。
数据包络分析是通过对投入的指标和产出的指标做了一个线性规划,并且进行变换后,然后根据其线性规划的对偶问题(线性规划对偶问题具有经济学意义),求解这个对偶问题的最值就是θ。

三、实例分析

1、spsspro上传数据

输入变量:政府财政收入占GDP的比例、环保投资占GDP的比例、每千人科技人员数。
输出变量:经济发展(用人均GDP表示)、环境发展(用城市环境质量指数表示;计算过程中,城市环境指数的数值作了 归一化处理)。

2、选择输入输出变量

3、效益分析表

决策单元

技术效益

规模效益

综合效益

松弛变量S-

松弛变量S+

有效性

1990

0.938

0.309

0.290

0.926

0.132

非DEA有效

1991

0.876

0.326

0.285

0.586

0.054

非DEA有效

1992

0.885

0.335

0.297

0.241

0.084

非DEA有效

1993

0.875

0.391

0.343

0.144

0.082

非DEA有效

1994

0.905

0.507

0.459

2.172

0.000

非DEA有效

1995

0.977

0.735

0.718

6.246

582.860

非DEA有效

1996

1.000

0.907

0.907

5.505

0.000

非DEA有效

1997

1.000

1.000

1.000

0.000

0.000

DEA强有效

1998

1.000

1.000

1.000

0.000

0.000

DEA强有效

1999

1.000

1.000

1.000

0.000

0.000

DEA强有效

BCC模型(VRS)把综合效益分解为技术效益和规模效益。
● 综合技术效益(overall efficiency,OE)反映的是决策单元在一定(最优规模时)投入要素的生产效率,是对决策单元的资源配置能力、资源使用效率等多方面能力的综合衡量与评价,值等于1时,代表该决策单元的投入与产出结构合理,相对效益最优;
值大于1时,代表该决策单元的投入与产出结构处于超级效益模式;
值小于1时,代表该决策单元的投入与产出结构不合理,相对效益未能达到最优,可能存在不同程度的投入冗余和产出不足,其值为技术效益*规模效益。
● 技术效益(technical efficiency,TE)反映的是由于管理和技术等因素影响的生产效率,其值等于1时,代表投入要素得到了充分利用,在给定投入组合的情况下,实现了产出最大化。
● 规模效益(scale efficiency,SE)反映的是由于规模因素影响的生产效率,通常结合规模报酬表进行分析其值等于1时,代表规模效率有效(规模报酬不变),也就是规模适宜,已达到最优的状态;若规模报酬递增(并非其值递增递减或者小于0大于0),代表服务规模过小,需要扩大规模以增加规模效益;若规模报酬递减(并非其值递增递减或者小于0大于0),代表服务规模过大,存在规模过度扩张风险。
● 松驰变量S-(差额变数)指为达到目标效率可以减少的投入量,即非 DEA 有效单元的实际值和目标值之差,
松驰变量S+(超额变数)指为达到目标效率可以增加的产出量,即非 DEA 有效地区的目标值和实际值之差。
● 有效性分析结合综合效益指标,S-和S+共3个指标,可判断DEA有效性,如果综合效益=1且S-与S+均为0,则“DEA强有效”,如果综合效益为1但S-或S+大于0,则“DEA弱有效”,如果综合效益<1则为“非DEA有效”。

4、效益有效性分析

5、规模报酬分析

规模报酬系数

类型

1990

0.299

规模报酬递增

1991

0.326

规模报酬递增

1992

0.335

规模报酬递增

1993

0.389

规模报酬递增

1994

0.453

规模报酬递增

1995

0.590

规模报酬递增

1996

0.778

规模报酬递增

1997

1.000

规模报酬固定

1998

1.000

规模报酬固定

1999

1.000

规模报酬固定

6、象限分析

决策单元

投入

产出

象限分布

1990

0.614

-4560.500

第二象限

1991

2.832

-4238.500

第二象限

1992

1.748

-4094.830

第二象限

1993

1.959

-3276.830

第二象限

1994

1.359

-1869.830

第二象限

1995

-0.450

-8.170

第三象限

1996

-1.984

2054.500

第四象限

1997

-2.707

3912.830

第四象限

1998

-1.986

5421.830

第四象限

1999

-1.386

6659.500

第四象限

7、投入冗余分析

决策单元

松驰变量S-分析

投入冗余率

政府财政收入占GDP的比例/%

环保投资占GDP的比例/%

每千人科技人员数/人

汇总

政府财政收入占GDP的比例/%

环保投资占GDP的比例/%

每千人科技人员数/人

1990

0.286

0.000

0.640

1.000

0.020

0.000

0.020

1991

0.586

0.000

0.000

1.000

0.035

0.000

0.000

1992

0.241

0.000

0.000

0.000

0.016

0.000

0.000

1993

0.144

0.000

0.000

0.000

0.009

0.000

0.000

1994

0.322

0.000

1.850

2.000

0.023

0.000

0.057

1995

1.314

0.000

4.932

6.000

0.099

0.000

0.160

1996

1.217

0.000

4.288

6.000

0.095

0.000

0.147

1997

0.000

0.000

0.000

0.000

0.000

0.000

0.000

1998

0.000

0.000

0.000

0.000

0.000

0.000

0.000

1999

0.000

0.000

0.000

0.000

0.000

0.000

0.000

投入冗余分析(差额变数分析)主要用于分析各变量需要减少多少投入时才能达目标效率。
● 松驰变量S-(差额变数)指为达到目标效率需要减少的投入量。
● 投入冗余率指“过多投入”与已投入的比值,该值越大意味着“过多投入”越多。

8、产出不足分析

决策单元

松驰变量S+分析

产出不足率

人均GDP/元

城市环境质量指数

汇总

人均GDP/元

城市环境质量指数

1990

0.000

0.132

0.000

0.000

None

1991

0.000

0.054

0.000

0.000

0.599

1992

0.000

0.084

0.000

0.000

1.206

1993

0.000

0.082

0.000

0.000

0.628

1994

0.000

0.000

0.000

0.000

0.000

1995

582.860

0.000

583.000

0.071

0.000

1996

0.000

0.000

0.000

0.000

0.000

1997

0.000

0.000

0.000

0.000

0.000

1998

0.000

0.000

0.000

0.000

0.000

1999

0.000

0.000

0.000

0.000

0.000

产出不足分析(超额变数分析)主要用于分析各变量需要增加多少产出时达目标效率。
● 松驰变量S-(超额变数)指为达到目标效率可以增加的产出量。
● 产品不足率指“产出不足”与已产出的比值,该值越大意味着“产出不足”越多。

参考资料

浅谈数据包络分析 - 知乎 (zhihu.com)

(5条消息) 数学建模常用模型10 :数据包络(DEA)分析法(投入产出法)_Halosec_Wei的博客-CSDN博客_dea投入产出

数学建模数据包络分析DEA详细教程PPT课件 - 道客巴巴 (doc88.com)

原文地址:https://blog.csdn.net/m0_52124992/article/details/128820934

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读5.3k次,点赞10次,收藏39次。本章详细写了mysql的安装,环境的搭建以及安装时常见的问题和解决办法。_mysql安装及配置超详细教程
文章浏览阅读1.8k次,点赞50次,收藏31次。本篇文章讲解Spark编程基础这门课程的期末大作业,主要围绕Hadoop基本操作、RDD编程、SparkSQL和SparkStreaming编程展开。_直接将第4题的计算结果保存到/user/root/lisi目录中lisipi文件里。
文章浏览阅读7.8k次,点赞9次,收藏34次。ES查询常用语法目录1. ElasticSearch之查询返回结果各字段含义2. match 查询3. term查询4. terms 查询5. range 范围6. 布尔查询6.1 filter加快查询效率的原因7. boosting query(提高查询)8. dis_max(最佳匹配查询)9. 分页10. 聚合查询【内含实际的demo】_es查询语法
文章浏览阅读928次,点赞27次,收藏18次。
文章浏览阅读1.1k次,点赞24次,收藏24次。作用描述分布式协调和一致性协调多个节点的活动,确保一致性和顺序。实现一致性、领导选举、集群管理等功能,确保系统的稳定和可靠性。高可用性和容错性Zookeeper是高可用的分布式系统,通过多个节点提供服务,容忍节点故障并自动进行主从切换。作为其他分布式系统的高可用组件,提供稳定的分布式协调和管理服务,保证系统的连续可用性。配置管理和动态更新作为配置中心,集中管理和分发配置信息。通过订阅机制,实现对配置的动态更新,以适应系统的变化和需求的变化。分布式锁和并发控制。
文章浏览阅读1.5k次,点赞26次,收藏29次。为贯彻执行集团数字化转型的需要,该知识库将公示集团组织内各产研团队不同角色成员的职务“职级”岗位的评定标准;
文章浏览阅读1.2k次,点赞26次,收藏28次。在安装Hadoop之前,需要进行以下准备工作:确认操作系统:Hadoop可以运行在多种操作系统上,包括Linux、Windows和Mac OS等。选择适合你的操作系统,并确保操作系统版本符合Hadoop的要求。安装Java环境:Hadoop是基于Java开发的,因此需要先安装和配置Java环境。确保已经安装了符合Hadoop版本要求的Java Development Kit (JDK),并设置好JAVA_HOME环境变量。确认硬件要求:Hadoop是一个分布式系统,因此需要多台计算机组成集群。
文章浏览阅读974次,点赞19次,收藏24次。# 基于大数据的K-means广告效果分析毕业设计 基于大数据的K-means广告效果分析。
文章浏览阅读1.7k次,点赞6次,收藏10次。Hadoop入门理论
文章浏览阅读1.3w次,点赞28次,收藏232次。通过博客和文献调研整理的一些农业病虫害数据集与算法。_病虫害数据集
文章浏览阅读699次,点赞22次,收藏7次。ZooKeeper使用的是Zab(ZooKeeper Atomic Broadcast)协议,其选举过程基于一种名为Fast Leader Election(FLE)的算法进行。:每个参与选举的ZooKeeper服务器称为一个“Follower”或“Candidate”,它们都有一个唯一的标识ID(通常是一个整数),并且都知道集群中其他服务器的ID。总之,ZooKeeper的选举机制确保了在任何时刻集群中只有一个Leader存在,并通过过半原则保证了即使部分服务器宕机也能维持高可用性和一致性。
文章浏览阅读10w+次,点赞62次,收藏73次。informatica 9.x是一款好用且功能强大的数据集成平台,主要进行各类数据库的管理操作,是使用相当广泛的一款ETL工具(注: ETL就是用来描述将数据从源端经过抽取(extract)、转换(transform)、加载(load)到目的端的过程)。本文主要为大家图文详细介绍Windows10下informatica powercenter 9.6.1安装与配置步骤。文章到这里就结束了,本人是在虚拟机中装了一套win10然后在此基础上测试安装的这些软件,因为工作学习要分开嘛哈哈哈。!!!!!_informatica客户端安装教程
文章浏览阅读7.8w次,点赞245次,收藏2.9k次。111个Python数据分析实战项目,代码已跑通,数据可下载_python数据分析项目案例
文章浏览阅读1.9k次,点赞61次,收藏64次。TDH企业级一站式大数据基础平台致力于帮助企业更全面、更便捷、更智能、更安全的加速数字化转型。通过数年时间的打磨创新,已帮助数千家行业客户利用大数据平台构建核心商业系统,加速商业创新。为了让大数据技术得到更广泛的使用与应用从而创造更高的价值,依托于TDH强大的技术底座,星环科技推出TDH社区版(Transwarp Data Hub Community Edition)版本,致力于为企业用户、高校师生、科研机构以及其他专业开发人员提供更轻量、更简单、更易用的数据分析开发环境,轻松应对各类人员数据分析需求。_星环tdh没有hive
文章浏览阅读836次,点赞21次,收藏19次。
文章浏览阅读1k次,点赞21次,收藏15次。主要介绍ETL相关工作的一些概念和需求点
文章浏览阅读1.4k次。本文以Android、java为开发技术,实现了一个基于Android的博物馆线上导览系统 app。基于Android的博物馆线上导览系统 app的主要使用者分为管理员和用户,app端:首页、菜谱信息、甜品信息、交流论坛、我的,管理员:首页、个人中心、用户管理、菜谱信息管理、菜谱分类管理、甜品信息管理、甜品分类管理、宣传广告管理、交流论坛、系统管理等功能。通过这些功能模块的设计,基本上实现了整个博物馆线上导览的过程。
文章浏览阅读897次,点赞19次,收藏26次。1.背景介绍在当今的数字时代,数据已经成为企业和组织中最宝贵的资源之一。随着互联网、移动互联网和物联网等技术的发展,数据的产生和收集速度也急剧增加。这些数据包括结构化数据(如数据库、 spreadsheet 等)和非结构化数据(如文本、图像、音频、视频等)。这些数据为企业和组织提供了更多的信息和见解,从而帮助他们做出更明智的决策。业务智能(Business Intelligence,BI)...
文章浏览阅读932次,点赞22次,收藏16次。也就是说,一个类应该对自己需要耦合或调用的类知道的最少,类与类之间的关系越密切,耦合度越大,那么类的变化对其耦合的类的影响也会越大,这也是我们面向对象设计的核心原则:低耦合,高内聚。优秀的架构和产品都是一步一步迭代出来的,用户量的不断增大,业务的扩展进行不断地迭代升级,最终演化成优秀的架构。其根本思想是强调了类的松耦合,类之间的耦合越弱,越有利于复用,一个处在弱耦合的类被修改,不会波及有关系的类。缓存,从操作系统到浏览器,从数据库到消息队列,从应用软件到操作系统,从操作系统到CPU,无处不在。
文章浏览阅读937次,点赞22次,收藏23次。大数据可视化是关于数据视觉表现形式的科学技术研究[9],将数据转换为图形或图像在屏幕上显示出来,并进行各种交互处理的理论、方法和技术。将数据直观地展现出来,以帮助人们理解数据,同时找出包含在海量数据中的规律或者信息,更多的为态势监控和综合决策服务。数据可视化是大数据生态链的最后一公里,也是用户最直接感知数据的环节。数据可视化系统并不是为了展示用户的已知的数据之间的规律,而是为了帮助用户通过认知数据,有新的发现,发现这些数据所反映的实质。大数据可视化的实施是一系列数据的转换过程。