数据驱动的制造业可持续性评估

2022-09-05 06:34张旭刚王玉玲江志刚
计算机集成制造系统 2022年8期
关键词:可持续性矩阵制造业

张旭刚,陈 洁,王玉玲,张 华,江志刚,蔡 维

(1.武汉科技大学 冶金装备及其控制教育部重点实验室,湖北 武汉 430081 ;2.武汉科技大学 机械传动与制造工程湖北省重点实验室,湖北 武汉 430081;3.西南大学 工程技术学院,重庆 400715; 4.香港理工大学 物流与航运系,香港 999077)

0 引言

可持续生产是现代制造企业的竞争优势,不仅可以帮助企业提高生产效率,降低生产成本,还能减少环境污染,降低碳排放且提高能源使用率。制造业可持续性能的正确评估是实现可持续发展的基础,也是产业结构优化和改造的依据。现代制造行业生产全生命周期中伴随着大量的数据生成,这使得利用大数据分析制造业的生产可持续性能成为可能。可持续性能是经济能力、环境效益、科技创新、社会责任等多因素的综合反映,因此必须采用基于数据的多属性的决策方法,传统多属性决策方法如层次分析法(Analytical Hierarchy Process, AHP)[1],网络分析法(Analytic Network Process, ANP)[2], 决策、试验和评价实验法(Decision-making Trial and Evaluation Laboratory, DEMATEL)[3-5],理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)[6],基于DEMATE的网络分析法(Dematel Analytic Network Process, DANP)[7]和BWM方法(best-worst method)[8]等,主要依赖于专家的经验和意见,使决策结果有一定的主观性。随着大数据和人工智能的兴起,利用神经网络求解决策者偏好的研究也越来越多。GOLMOHAMMADI等[9]提出一种基于前馈神经网络的模糊多准则决策模型,该模型可以用于获取和表示决策者的偏好,通过神经网络的自学习,可以得到属性与方案之间的关系,进而对方案进行排序和选择;CHEN等[10]提出一种基于决策神经网络(Decision-making Neural Network, DNN)的多准则决策方法,通过交互式过程不断对模型进行修正,最终可以求得最优化问题的解;AMIR等[11]提出一种聚类与多准则决策相结合的方法,以解决可持续发展的供应商选择问题,该方法首先采用神经网络的自组织映射方法,基于客户需求属性和可持续性因素对供应商进行聚类和预确定,再利用多准则决策方法对供应商集群进行排序,以协调供应商与客户之间的关系;朱海平等[12]将径向基神经网络与仿真实验相结合来探究制造系统性能指标与影响这些指标的静动态因素的复杂关系,该方法能够很好地预测制造系统的性能指标,如平均完工时间和设备利用率;倪维健等[13]采用基于注意力的双向循环神经网络模型来预测业务流程剩余时间,所提出的方法较传统方法具有更好的性能。BP神经网络与DEMATEL方法相结合的应用也有很多,如崔强等[14]基于BP-DEMATEL方法,分析了空港竞争力影响因素间的关系,为日后提高空港竞争力提供了一定的理论支持;王景春等[15]采用基于BP-DEMATEL-SW的方法确定了河北省应急管理的关键影响因素,并提出了相应的优化策略;张秋等[16]利用BP-DEMATEL模型,分析了我国直辖市创业环境影响因素间的相互关系,给出了影响创业环境的驱动因素和结果因素,并针对直辖市特色提出了相应的改进方法;LI等[17]采用鲁棒性分析和BP-DEMALTE模型相结合的方法来评估生态安全性及其影响因素。

综上可知,虽然基于数据的多属性决策模型研究有很多,但仍存在以下不足:

(1)由于制造业涉及大量的属性数据,对其进行的可持续性评估较为复杂,也缺少全面而具体的评估方法,并且以制造业为研究对象的数据多属性评估文章偏少。

(2)多数制造业所用的基于数据的多属性决策模型依赖专家打分或问卷调查,具有一定的主观性。

(3)多属性决策模型 (Multiple Attribute Decision-making Model, MADM)应该是一个全面、综合的模型,而大多数提出的模型并没有分析制造业在分因素下(经济、环境和科技)的发展情况以及制造业数据属性间的因果关系,这不利于制造行业提升可持续性能。

(4)大多数模型难以为制造业提出具有针对性的优化策略,只是给出整体的优化方案或建议。

因此,本文采用BP-DEMATEL和ANP相结合的方法(即BP-DANP)不仅求出了数据属性的综合权重,还给出了数据属性的因果关系图(Influence Strength Network Relationship Map,ISNRM)和主要影响强度路径图(Critical Influence Strength Route,CISR),并通过MOORA方法有针对性地对不同行业提出了优化决策。主成分分析法(Principal Component Analysis,PCA)是一种客观的多属性评价方法,它通过求解变量间的主成分来进行降维,并最大化地保留原始数据信息,通常可以利用该特性来求数据属性的权重[18-20]。因此,本文首先采用PCA评估制造业在分因素的可持续性能,再采用梯度反向传播算法(Backpropagation,BP)训练前馈神经网络,以综合分析制造业影响因素间的关系。利用这些先进的数据分析和挖掘技术,可以探索制造业数据潜在的意义和价值。

本文首先分析了影响制造业可持续性发展能力的因素,以中国22个制造业为研究对象,建立了制造业可持续性发展评价指标体系,并运用PCA评估了制造业分因素下的可持续性发展能力。为了分析这些数据属性对制造业的综合影响度,本文采用BP-DEMATEL方法,该方法可以确定属性间的因果关系,且完全不需要专家的主观评分作为模型的输入。首先利用开源的深度学习框架Pytorch搭建BP神经网络,并确定网络的输入和输出属性,以均方误差(Mean Square Error, MSE)作为模型的损失函数来迭代模型,将模型输出与DANP方法结合来获得数据属性的综合权值和属性间的ISNRM、CISR。最后采用MOORA方法来评估各制造业当前可持续发展性能与期望性能之间的差距。MOORA方法常用来同时优化两个或多个矛盾的准则,在这些准则中有些是需要最大化的(即有益属性),有些是需要最小化的(即无益属性),而MOORA方法通过考虑有益属性和无益属性来选择和排序一些可替代方案[21-23]。本文所提出的评估方法可以不依赖于专家意见,使评估结果更具客观性和鲁棒性,通过真实环境中的数据与CISR图的可视化,可以方便行业决策者快速定位到可持续性评估的关键属性,将制造业当前可持续性能与期望性能进行比较,有利于制造业寻找自身的差距,从而为制造业提供了可持续性发展评估和优化的方向。

1 问题描述与模型构建

1.1 问题描述

本文建立了一个数据驱动的多属性决策模型(MADM)来评估制造业的可持续性发展能力。首先采用PCA方法,分析各制造业分因素的可持续性发展能力。本文认为影响制造业可持续性发展能力的三大指标(属性)为:经济属性,环境属性和科技属性,这些属性下还有相关的子属性。为了综合分析各属性的影响作用,采用BP神经网络建立直接影响强度关系矩阵,再利用DANP方法获得各属性的综合影响权重、ISNRM和CISR图,最后采用MOORA方法计算各制造业可持续性能的排名以及制造业当前可持续性能与期望性能之间的差距比率。具体建模过程如图1所示。

1.2 模型的建立

1.2.1 主成分分析

(1)计算指标的相关系数矩阵Rn×n, 求Rn×n的特征值λ和特征向量μ,并根据特征根大于1、累计方差贡献率大于80%的原则选择主成分,n为子属性的个数。

(2)计算因子载荷量ρ,因子载荷量是主成分与原始指标的相关系数。

(1)

(4)确定指标权重:

(2)

式中:v表示指标的主成分的方差贡献率;F·v表示指标的线性组合系数对指标的方差贡献率的加权和;sum(v)表示v向量各元素之和。最后对指标权重进行归一化。

(5)计算各个行业在不同属性下的可持续性能得分。先对数据进行百分制转换,即对各行业的相同指标进行排序,以最高值为基准,计算其他行业占最高值的百分率,将具有最高值的行业得分记为100分,其他行业对应的分数即为百分制分数。最后将百分制分数乘以分因素的权重,可以得到各制造业分因素下的综合得分。

1.2.2 BP-DANP方法

(1)对收集来的数据进行预处理,如将数据正向化和归一化。

(2)搭建BP神经网络。这里的神经网络只有3层,即输入层、隐藏层和输出层,确定输入层和输出层的决策属性,以及隐藏层神经元个数。

(3)计算权值向量w=mean(|W|·|w|),其中w为输入层和隐藏层的权值矩阵,w=(w1,w2,…,wn);n为输入属性的个数;W为隐藏层和输出层的权值矩阵;| |表示对矩阵元素取绝对值;·表示矩阵乘法;mean表示对|W|·|w|矩阵每列取平均值。

(4)计算输入数据属性的直接影响关系矩阵:

(3)

(5)归一化B矩阵得到X:

(4)

(6)计算综合影响矩阵:

T=X(I-X)-1。

(5)

式中I为单位矩阵,(I-X)-1为(I-X)的逆矩阵:

(7)计算中心度和原因度。矩阵T的所有行向量和列向量可分别由式(6)和式(7)计算获得:

(6)

(7)

其中:′ 表示矩阵的转置;gi表示ith个属性对其他所有属性直接或间接的影响,也称为ith个属性的影响度;ri表示ith个属性受其他所有属性直接或间接的影响,也称为ith个属性的被影响度。

指标(gi+ri)定义为属性i的中心度,可以在一定程度上反映该属性对制造业可持续性发展能力的影响度大小,值越大说明该属性越重要。指标(gi-ri)定义为属性i的原因度,它表示属性间的原因—结果关系,当(gi-ri)为正值时,说明属性i对其他因素影响较大并被划分为原因因素;相反则说明属性i容易受其他属素影响,被分为结果因素。

(8)构建权重超矩阵:

(8)

(9)对矩阵WΘ求极限,得到各属性的影响强度权重,如式(9)所示:

(9)

1.2.3 使用MOORA评估差距比率

(1)构建性能矩阵。性能矩阵是基于真实环境中与制造业可持续性评估相关的性能数据。矩阵E=[exy]v×n,x∈{1,2,…,v},y∈{1,2,…,n}反映了xth制造业在yth属性上的性能。其中v表示候选的制造业的个数;n表示真实性能数据属性的个数。

(2)归一化性能矩阵,如式(10)所示:

(10)

通过引入期望值概念,可将式(10)表达为:

(11)

(3)计算每个制造业的可持续性能差距比率,

(12)

(4) 确定每个制造业可持续性能的最大差距比率。

(13)

式中Qx为第x个制造业可持续性能的有待改进量,值越小越好。

2 案例分析

2.1 指标体系的构建

制造业是人类生活和文明的依托,也是我国一大产业,其GDP增长值直接影响了我国社会的发展。但制造业在创造财富的同时也消耗了巨大的自然资源,对环境造成了不可估量的伤害。可持续性发展要求在保持经济发展的同时,约束资源消耗,促进人与自然和谐相处。因此,可持续发展理念成了国内外专家和学者的研究热点。

目前国际普遍接受的可持续性发展原则是:可持续发展是指既满足当代人的需要,又不对后代人满足其自身需求的能力构成危害的发展,或在不危及后代人需求的前提下,寻求满足当代人需求的发展途径。在这之前,许多专家和机构组织(如联合国可持续发展委员会(UNCSD)、联合国统计局可持续发展指标体系、联合国经济和社会事务部(DESA)和环境问题科学委员会等)从不同角度(如经济、社会、环境、资源、人口、发展等)提出和构建了可持续发展指标体系。但由于各个可持续发展理论的研究主体和在指标上的侧重点不同,至今都没有一套综合和标准的制造业可持续发展指标体系。因此,本文根据制造业特点,参考国际上关于可持续发展能力指标设计的标准[24-27]以及文献[20,28-32]的指标选取,并结合数据的可得性确定了二级的制造业可持续发展评估指标体系,可持续性指标的选取要能体现可持续发展的协调性、系统性和可持续性。整个指标体系分为两级,第一级指标(属性)有3个,且每个一级指标下还包含4个二级指标,共有12个属性指标。

(1)一级指标

一级指标包括:经济(A1)、环境(A2)和科技(A3)。经济可持续性是制造业可持续发展的基础,环境可持续性是制造业可持续发展的关键,科技可持续性是制造业可持续发展的重要手段[28]。

(2)二级指标

二级指标有12项。经济子指标有:资产总计(亿元)(B1+)、固定资产投资比率(%)(B2+)、平均用工人数(万人)(B3+)、从业人员(万人)(B4+);环境子指标有:能源消费总量(万吨标准煤)(B5-)、废水排放量(万吨)(B6-)、废气排放量(亿立方米)(B7-)、固体废物产生量(万吨)(B8-);科技子指标有:R&D人员全时当量(人年)(B9+)、新产品开发项目数(项)(B10+)、有产品或工艺创新活动的比重(%)(B11+)、R&D经费支出(亿元)(B12+)。

括号中的“+”和“-”号代表指标的方向性,正向指标表示该指标值越大越好,负向指标表示该指标值越小越好。如表1所示为12项属性指标选取的参考文献。

表1 制造业可持续性指标选取的参考文献

续表1

2.2 数据搜集

本文数据来源于《中国统计年鉴》、《中国环境统计年鉴》、《中国能源统计年鉴》、《中国工业统计年鉴》和《中国科技统计年鉴》(均截止2018年末)。因为废水排放量、废气排放量和固体废物产生量三个属性的数据在2018年缺失且只能找到2014年的数据,所以以此代替,但这样的替换不会对制造业可持续性能评估的整体方向造成较大影响。

2.3 分因素的制造业可持续性评估

2.3.1 主成分分析

制造业可持续性评估包括经济可持续性、环境可持续性和科技可持续性评估,因此采用PCA方法分别评价经济、环境和科技指标下的可持续性能。首先对数据指标进行正向化[10]及标准化处理,再输入到SPASS软件中进行主成分分析,可以得到分因素下的特征值、方差贡献率和累积方差贡献率,如表2所示。根据特征根大于1,累计方差贡献率大于80%的原则选择主成分。由表2可知,经济指标前两项的累积方差贡献率为95.870%,虽然第2项的特征值小于1,但是这两项包含了大部分原始数据的信息,因此仍以这两项作为主成分。环境指标也选择前两项作为主成分,科技指标第一项方差贡献率为81.853%,大于80%,因此选其为主成分。

表2 分因素的特征值、方差贡献率和累积方差贡献率

2.3.2 分因素的权重

首先计算因子载荷量ρ,再根据式(1)和式(2)计算分因素下各属性的权重,如表3所示。

表3 分因素下各指标的权重

2.3.3 综合得分

根据1.2.1节第(5)部分方法求各指标评分,然后乘以表3中对应的权重,可以得到各个制造业分因素下的可持续性能的评分。表4~表6分别显示了经济、环境和科技方面各制造业可持续性发展能力的评分(由高到低)。

表4 经济可持续性评估

续表4

表5 环境可持续性评估

表6 科技可持续性评估

续表6

表4~表6中,结果有正数和负数,正负并不代表制造业可持续性能的真实水平,只能表示制造业在分因素下的相对位置。负数表示制造业在当年某个指标下的能力低于平均水平,正数则表示高于平均水平,且正值越大,综合得分越高,制造业的可持续发展能力越强。由表4可以看出,在经济指标下,得分最高的前3个制造业分别是计算机、通信和其他电子设备制造业,电气机械和器材制造业以及非金属矿物制品业,说明这3个行业在2018年经济水平较高,而排名最后的金属制品、机械和设备修理业得分为负,说明相比于其他制造业,该行业在2018年经济状态欠佳,呈现下降的趋势;从表5可以看到,在环境指标下,得分最高的前3个制造业分别为金属制品、机械和设备修理业,仪器仪表制造业以及家具制造业。这些制造业的生产模式较符合“绿色制造”,而排名较后的3个行业分别是非金属矿物制品业,石油加工、炼焦和核燃料加工业,以及化学原料和化学制品制造业,说明这些行业在生产中排放了较多的环境污染物,并且消耗了较多的能源。可以看到,该指标下各制造业的评分普遍偏低,说明制造业的环境可持续性能还有待发展和提高。从表6可以看到,在科技指标下,得分最高的前3个制造业分别是计算机、通信和其他电子设备制造业,电气机械和器材制造业,以及汽车制造业,这3个制造业具有较高的科技水平。主要原因是:近些年先进信息技术、网络技术和计算机技术的发展促使计算机、通信和其他电子设备制造业的技术水平飞速提升,而传统制造业通过引进新的生产技术、生产模式、工艺、精密先进的机械设备,大大提高了生产效率,提升了生产的柔性度和智能度。科技水平最差的行业为废弃资源综合利用业。

通过上述分析可知,制造业在分因素下可持续性能发展水平迥异,呈现出不均衡的发展趋势。

2.4 基于BP-DANP综合可持续性评估

2.4.1 BP神经网络构建直接影响度矩阵

传统的直接影响度矩阵计算方法依赖于专家意见,具有一定的主观性和局限性,因此本文利用BP神经网络可以学习权重的特点来探索数据指标间的关联。模型的输出属性为B1和B12,以它们为制造业可持续性能的结果度量指标,其余为输入属性。BP神经网络输出指标的选取要能体现各属性间的相互作用,能综合反映制造业可持续性能的整体情况,并且定义值越大越好的指标为输出指标较好[16,33],该输出指标需要由一些有经验的专家来确定。本文认为资产和技术最能度量制造业的可持续性能,因此以它们做为输出指标。依据文献[34]方法设置隐藏层神经元个数为10,非线性激活函数为”RELU”,总迭代次数为4 000,学习率为0.01,训练目标误差为0.001。随着网络的训练,样本误差逐渐减小,在第2 898步时,模型达到指定的误差精度,模型停止训练,如图2所示。

基于网络得到的权重,运用式(3),得到直接影响度矩阵B,如表7所示。

表7 直接影响度矩阵B

2.4.2 中心度和原因度

将直接影响度矩阵B归一化,并按式(4)和(5)计算综合影响度矩阵T,如表8所示。再根据式(6)和式(7)得到各个输入属性的影响度、被影响度、原因度、中心度以及所属的因果组,如表9所示。

表8 综合影响度矩阵T

续表8

表9 中心度和原因度

根据表9绘制因果关系图(ISNRM),如图3所示。

由图3可知,原因因素为平均用工人数、从业人员、R&D人员全时当量、废气排放量和固体废物产生量,剩余的为结果因素。原因因素的中心度排名为:固体废物产生量(B8)>R&D人员全时当量(B9)>平均用工人数(B3)>从业人员(B4)>废气排放量(B7)。这几个因素不仅影响制造业的可持续发展能力,还对结果因素有一定的影响,其中影响度最大的为固体废物产生量。可见,要提高制造业可持续发展水平,控制行业的固体废物产生量是必要的。此外,经济和环境指标下的因素占了两项,说明制造业的可持续发展较大程度上取决于经济发展、能源充足、环境友好。当然,科学技术是第一生产力,科技层面的支持对制造业发展也是必不可少的。为了帮助决策者更好地理解各个属性的关系,这里构建网络影响度矩阵R,R可以用来确定各个属性之间的影响级别。在综合影响度矩阵T的基础上,通过确定τ=tio-toi((i,o∈1,2,…n)的值来创建矩阵R,n为属性的个数。当τ>0时,表明属性i影响属性o,因此tio标记为1,toi标记为0,反之则相反[35]。重复上述计算,可以得到10个属性的网络影响度矩阵R(如表10)以及CISR(如图4)

由图4可知,5个原因因素影响级别高于结果因素,它们对制造业的可持续性能贡献较大,更容易影响其他因素且较难被其他因素所影响。在结果因素中,有产品或工艺创新活动的比重(B11)对制造业的可持续发展能力影响级别最低。根据CIRS图,企业管理者可以很方便地找出影响因素和被影响因素,从而能够有效地抓住关键属性来制定优化策略。

2.4.3 综合权重

根据式(8)和式(9)构建权重超矩阵,并对矩阵求极限,可以得到各个输入属性的权重如表11所示。

表10 网络影响度矩阵R

表11 各属性的综合权重

由表11可知,排名前3的属性为: 有产品或工艺创新活动的比重、 废水排放量和能源消费总量。这些因素权重较高,它们对制造业的可持续发展能力影响较大。

2.5 MOORA方法评估差距比率

由表12可知,可持续发展能力较大的前6个行业为:仪器仪表制造业、电气机械和器材制造业、专用设备制造业、通用设备制造业、烟草制品业以及计算机、通信和其他电子设备制造业,其最大差距比率分别为0.091,0.119,0.122,0.116和0.131。本文以前3个可持续发展能力较大的制造业为例,构建基于表12和CIRS图的可持续性能优化策略[35],如图5所示。

表12 各制造业性能差距比率

续表12

由图5可以看到,仪器仪表制造业具有最大差距比率的属性为能源消费总量(B5),它主要受到固定资产投资比率(B2)属性的影响,且B2的差距比率值也比较大。因此,仪器仪表制造业应致力于提高固定资产投资比率来提升企业的可持续性发展能力。电气机械和器材制造业具有最大差距比率的属性为废水排放量(B6),它主要受到能源消费总量(B5)的影响,且B5的差距比率值也比较大。因此电气机械和器材制造业应致力于控制企业的能源消费总量,通用设备制造业与电气机械和器材制造业优化策略相似。通过这种方法可以得到各个制造业主要优化的因素,从而可以有针对性地制定优化策略。

3 结束语

传统的多属性决策模型(MADM)模型主要基于专家的意见去选择最佳的可替代方案,虽然在一定程度上可以给出性能的评估和方案的排名,但是它们难以反映研究对象的真实情况。因此,本文建立了基于数据驱动的MADM,首先使用PCA方法分别分析了制造业的环境、经济和科技的可持续性能,可知制造业在各指标下发展不平衡,即至少在某些指标上还有待增强,分因素评价有利于制造行业在社会发展新常态下进行可持续制造的定位和制定发展策略。其次将BP神经网络与DANP方法结合,求得了ISNRM、CISR和数据属性的综合影响权重。BP-DANP提供了一种无需专家打分或问卷调查的客观方法,能够有效分析影响制造业可持续性能的关联因素。MOORA方法和CISR图结合,不仅找出了源因素,还获得了不同制造业对应的可持续性能优化策略,而不只是一个可持续性能评估的排名结果。

根据这种新方法在制造业的应用结果可知,有产品或工艺创新活动的比重具有最大的综合权重,根属性是固体废物产生量。因此,制造业要想实现可持续发展,就必须提高科技水平来推陈出新,同时要注重控制固体废物的产生量,一方面可以保护环境,另一方面也可以节约能源。尽管该方法很有效,但未来研究,还应考虑更多的指标和更多真实环境中的数据。

猜你喜欢
可持续性矩阵制造业
竹子已在亚洲使用数千年。如今,它将有助于解决建筑业的可持续性问题
冰雪制造业的鲁企担当
水泥生产中环境可持续性研究进展
世界地球日50年来悬而未决的问题:如何构建一个更具可持续性的世界
喜看新中国七十年突飞猛进的制造业
初等行变换与初等列变换并用求逆矩阵
“烧钱”可持续性存疑美团被曝全年亏损72亿
矩阵
矩阵
矩阵