基于K-means算法的铁路运输设备单元划分方法

2018-06-29 01:22王华伟史天运闫永利
交通运输系统工程与信息 2018年3期
关键词:运输设备聚类铁路

王华伟,史天运*,闫永利

(1.中国铁道科学研究院电子计算技术研究所,北京100083;2.中国铁路总公司工电部,北京100844)

0 引 言

铁路运输设备是铁路运输生产的基础,是铁路运输安全有序的可靠保证,铁路机务、车辆、供电、工务、电务各专业分别建设了设备管理相关系统,已部分实现运输设备的专业化管理.然而对于运输设备的统一管理和综合评价还存在很大困难.管理单元是铁路运输设备监控、维修、管理及分析决策的基础对象和基本单位,因此运输设备单元划分合理与否,不仅会影响设备管理及决策分析的准确性,而且会影响设备的检修和维护工作效率.

因此,需要结合运输设备特点和管理需要,将铁路运输设备分成颗粒适度、便于管理、易于数据化的设备单元,从而实现运输设备的统一化、标准化管理,为设备管理及状态综合评价提供支撑.

单元化管理思想是来源于精益化管理,是成组技术理论的一个成功应用.王祖锦等[1]把单元化管理思想运用到物流管理行业,为精益物流管理提供了坚实的管理基础;邵敏华等[2]开展了公路管理单元动态划分技术研究;何洋等[3]开展铁路工务维修管理单元划分方法研究,为铁路运输设备单元化管理提供了成功的借鉴.然而,目前对于铁路运输设备统一的单元划分方法尚无相关研究,因此开展铁路运输设备单元划分方法研究,对于运输设备综合管理具有一定的创新性,具有非常重要的意义.

本文在分析铁路运输设备构成的基础上,总结提出铁路运输设备单元划分原则,基于K-means聚类算法开展铁路运输设备单元划分方法研究,并经过实践验证方法的科学性和合理行.

1 铁路运输设备构成

铁路运输设备构成按其应用特点可分为固定设备设施、移动设备、安全监测设备等几大类[4].具体分类如表1所示.

表1 铁路运输设备构成Table 1 Railway transportation equipment constituent

2 运输设备单元划分原则

充分考虑铁路各专业运输设备管理需求,铁路运输设备单元划分要遵循以下6个原则.

(1)单元划分的唯一性和独立性.

每个单元的划分明确区别于其他单元.保证运输设备单元划分的唯一性是管理单元的基础工作,每个独立的单元标识将是管理单元的“身份证”,直接影响到后续管理单元的管理及技术状态数据的标准化.应同时符合两方面的要求:一方面,应在运输设备综合管理系统中能准确、迅速地确定其单元身份;另一方面,符合用户管理习惯,并能在现场应用中准确定位.

(2)单元划分的完整性和简化性.

按照运输设备技术状态管理全寿命周期综合管理及状态评价的需要,各相关专业运输设备及组件都要包含在单元划分范围内,避免漏项,力求所有单元划分的完整性.同时,通过评价单元的划分,能够使运输设备管理及评价工作简化便捷,方便运用管理.

(3)生产组织及后期维护的便捷性.

铁路运输设备技术状态管理是一个复杂的系统化工程,涉及到设备从投产应用到报废全寿命周期的监测、检修、维护等诸多环节,设备管理单元的划分必须能够有效定位到相关设备,反映出问题所在,并能够把设备单元存在的问题与后期的维修养护进行管理.所以说,设备单元的划分不仅仅要考虑提高管理和分析的效率,而且要考虑到后期生产组织及后期维护的便捷性.

(4)技术状态数据采集单元与理论分析模型的统一性.

运输设备技术状态管理实质上就是采集运输设备单元全寿命周期内的履历数据、检测监控数据、检修维护数据等动静态单元数据,构建设备状态分析评价模型,对设备性能、健康状态等进行分析评价.因此,为保证理论分析的连贯性、科学性与一致性,对于设备技术状态的管理单元的划分,要与理论分析模型保持一致,保证技术状态数据采集单元与理论分析模型的统一性.

(5)单元划分粒度的适应性.

指运输设备单元划分粒度要适应各专业不同的运输设备管理需要及分析需求,分析哪些技术状态属性成为单元划分的依据,应视系统目标的侧重点找出影响系统决策分析的主要属性,对于不同性质的单元,提供灵活的、适宜的、粒度不同的单元划分标准.

(6)与生产布局和管理决策的一致性.

管理单元的划分要考虑数据分析后的利用价值,将为运输设备施工维修作业提供合理的方法和建议,优化检修作业流程,提高检修作业效率.因此,运输设备管理单元的划分要充分考虑生产布局及管理决策的需要,保持与生产力布局和管理决策的统一性,全面提升运输设备的管理及智能维修水平.

3 基于K-means的运输设备单元划分方法

3.1 K-means聚类算法理论

K-means算法是经典的划分聚类方法之一,算法效率较高,在大规格数据聚类时得到较为广泛的应用.K-means算法的基本原理是:首先设定k为参数,确定需要将含有n个对象的数据集划分成k个类,随机地选取k个对象作为初始聚类中心;然后,对于剩余的每个对象,根据距离公式计算该对象到每一个初始聚类中心的距离,将计算好的数据对象划分到最近的类中;最后重新计算每个类中心,不断重复这个过程,直到准则函数收敛[5-6].K-means通常采用平方误差准则函数进行收敛,其定义为

式中:E是数据集中所有对象的平方误差的总和;p是数据集中的点;mi是类Ci的平均值.

K-means聚类算法流程如图1所示.

图1 聚类分析算法流程图Fig.1 Flow chart of cluster analysis algorithm

3.2 运输设备单元划分指标

铁路运输设备单元划分的目的就是将各类运输设备设施分成便于监控管理、易于维护和量化分析的设备设施单元,满足设备监测、检修、维护、管理分析的需要.因而对于运输设备单元的划分要综合考虑设备日常监测、检修维护和管理分析过程中的重点因素,选择构建完整、科学、客观的设备单元划分指标,本文选择的铁路运输设备单元划分指标如表2所示.

表2 铁路运输设备单元划分指标Table 2 Railway transportation equipment unit division index

3.3 运输设备单元划分模型

基于K-means聚类算法的运输设备单元划分模型具体实现如图2所示.

图2 基于K-means聚类算法的运输设备单元划分模型Fig.2 Unit division model of railway transportation equipment based on K-means clustering algorithm

4 运输设备单元划分实例

4.1 实验步骤

按照运输设备单元划分原则,结合设备技术状态属性信息,现以电务通信设备为例对设备单元划分算法原理及实现流程进行说明[7-8],基于K-means的通信专业运输设备单元划分步骤如下.

Step 1设所有要纳入大数据平台管理的通信设备设施及相关设备组件类别集合为S,S1,S2,…,Sn表示每类通信设备及组件,比如通信机房、通信铁塔、通信光缆、通信电缆、分插复用设备、交流配电设备等,则有

Step 2准备样本数据.

①选取通信设备或组件的m个特征指标,若用P1,P2,P3,…,Pm表示,则

②根据管理需求及专家经验,按照表2选取特征指标,P1,P2,P3,…,P8,分别代表日常监测信息来源、日常检查周期、中修周期、大修周期、报废周期、设备所属类别、安装位置、设备基础信息来源等,从不同通信设备类别中按该类别设备所占总设备数量的比重选取48类通信设备单元划分样本建立矩阵S,如表3所示.

表3 铁路通信设备单元划分样本Table 3 Railway communication equipment unit division sample

③由于通信设备单元划分属性参数中既有定性指标,又有定量指标,且各指标数值的量纲不一致,因此特将样本矩阵数据做统一的归一化处理[9],如表4所示.

表4 铁路通信设备单元划分归一化样本Table 4 Railway communication equipment unit division sample normalization

Step 3根据聚类需要,初始化聚类中相关参数,所选参数在计算迭代过程中可以调整优化.

①确定数据集S需要划分的聚类个数k;

②设定迭代次数为X,令X=1;

③在数据集S中,随机选取k个数据对象,将这k个数据对象设定为初始聚类中心,即有C1(X),C2(X),C3(X),…,Ck(X)等k个初始聚类中心点;

④设定与聚类中心的距离参数ξ;

⑤选定数据样本点与聚类中心的距离计算公式,利用欧几里得距离公式式(4)进行计算.

式中:i=1,2,…,n;j=1,2,…,k.

Step 4利用式(4)分别计算样本点与聚类中心的距离,确定样本数据点归属的类.如果满足,那么

式中:C(z)表示以Cz(X)为中心点的聚类,即数据点Si归属于C(z)类.

Step 5若计算完成后,某分类C(z)中的样本数为零,则k=k-1,去掉该分类.

Step 6令X=X+1,计算新的k个聚类中心点.

式中:Nj为C(j)类中的样本个数.

Step 7计算平方误差准则函数E的值为

Step 8判断是否满足条件|E(I)-E(I-1) |<ξ,若满足,则算法结束;否则,返回Step4,继续执行迭代,直至结束.

4.2 实验结果

利用Matlab的聚类函数按上述步骤对通信设备样本进行聚类划分,设D为各类数据点到其对应的聚类中心的距离平方和,利用D值作为聚类亲和程度的衡量指标.随着聚类数量k的变化,对应的D值变化结果如图3所示.结果表明,当参数k=4时,D的变化趋于缓和,不再出现大幅的波动,因此最终聚类合适的分类个数为4,如果数量过少,划分各类中单元关系不紧密,如果数量过多,资源分类过细,造成管理的繁琐与不便.因此我们将最终的单元划分数目k值设定为4.当k=4时,通信设备单元划分结果如表5所示.

图3 D-k关系对应曲线Fig.3 D-krelation curve

表5 铁路通信设备单元一级聚类结果Table 5 Railway communication equipment unit first level clustering result

4.3 实验结论

由表5实验结果可以看出,基于K-means聚类的运输设备单元划分与传统的按设备类别分类方式存在不同程度的差异:比如通信机房,按照传统的设备分类方式,应与通信接入点、通信铁塔、通信杆柱等归为一类,同属于通信基础设施;而利用本文提出的单元划分方法,通信机房则与电源等动力设备等归为一类,原因是电源设备几乎都安装在通信机房内,且通信机房与电源等技术状态参数都由动环监测系统进行动态监测,技术状态分析和管理有着密切的关联关系,相比之下,通信机房与其他基础设施在状态监测与分析评价方面基本没有太多关联关系.再如电源设备,在传统的设备分类中,其与其他通信设备属于同一类,而本文提出的方法则将电源设备与其他通信设备分开,原因是电源设备无论从状态监测、检修维护还是管理分析,本质上跟其他普通通信设备存在差异.

由此可见,本文提出的基于K-means聚类的运输设备单元划分比传统的按设备类别分类,更符合设备技术状态管理和分析的需求,其与传统方式设备分类方式的具体对比如表6所示.

表6 本方法与传统的人工设备划分方法对比Table 6 The comparison between the proposed method and the traditional manual division method

总之,本文提出的基于K-means聚类的运输设备单元划分结合了设备日常监测、检修维护和管理分析等各类因素,与传统的单纯根据设备类别进行的设备分类方式相比较有明显的优势,具有很好的实用价值,更适合于运输设备生产组织、设备维护技术及状态分析和管理.

5 结论

本文对铁路运输设备构成进行了分析,明确了运输设备管理及单元划分的范围,总结分析了运输设备单元划分原则,研究提出基于K-means聚类的铁路运输设备单元划分方法,并选取电务通信专业运输设备的样本数据进行了方法验证,实验效果良好.今后,要考虑到专业管理的差异性,利用该方法更好地实现对其他专业设备管理单元的划分.

[1]王祖锦.物流单元化管理及专业单元化器具系列连载之一物流单元化管理的基本思想[J].物流技术与应用,2006,11(4):96-98.[WANG Z J.Logistics management on unit load system(Ⅰ)the basic concept of logistics management on unit load system[J].Logistics&Material Handling,2006,11(4):96-98.]

[2]邵敏华,孙立军.公路管理单元动态划分技术与数据模型研究[J].同济大学学报(自然科学版),2004,32(3):343-347.[SHAO M H,SUN L J.Research on segmentation technique and data modeling in highway management system[J].Journal of Tongji University,2004,32(3):343-347.]

[3]何洋,刘明亮,陈容淮,等.铁路工务维修管理单元划分方法研究[J].铁道标准设计,2016,60(11):14-18.[HE Y,LIU M L,CHEN R H,et al.Research on railway maintenance managementunitdivision method[J].Railway Standard Design,2016,60(11):14-18.]

[4]吴芳.铁路运输设备[M].北京:中国铁道出版社,2007.[WU F.Railway transportation equipment[M].Beijing:China Railway Press,2007.]

[5]杨阳.数据挖掘K-means聚类算法的研究[D].长沙:湖南师范大学,2015.[YANG Y.Research on K-means clustering algorithm in data mining[D].Changsha:Hunan Normal University,2015.]

[6]HONG Y,KWONG S.Learning assignment order of instancesforthe constrained K-meansclustering algorithm[J].IEEE Transactions on Systems Man&Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man&Cybernetics Society,2009,39(2):568-574.

[7]关云鸿.改进K-均值聚类算法在电信客户分类中的应用[J].计算机仿真,2011,28(8):138-140.[GUAN Y H.Application of improved K-means algorithm in telecom customer segmentation[J]. Computer Simulation,2011,28(8):138-140.]

[8]赵莉,候兴哲,胡君,等.基于改进K-means算法的海量智能用电数据分析[J].电网技术,2014,38(10):2715-2720.[ZHAO L,HOU X Z,HU J,et al.Improved K-means algorithm based analysis on massive data of intelligent power utilization[J]. Power System Technology,2014,38(10):2715-2720.]

[9]赵兴浩,邓兵,陶然.分数阶傅里叶变换数值计算中的量纲归一化[J].北京理工大学学报,2005,25(4):360-364.[ZHAO X H,DENG B,TAO R.Dimensional normalization in the digital computation of the fractional fourier transform[J].Transactions of Beijing Institute of Technology,2005,25(4):360-364.]

猜你喜欢
运输设备聚类铁路
基于传感器感知信息的物流运输设备故障自动识别
单驱动新型燃料水下运输设备设计与分析
沿着中老铁路一路向南
金矿提升运输设备机电控制的关键技术探析
运输设备制造业排污许可管理问题分析
基于K-means聚类的车-地无线通信场强研究
铁路通信线路维护体制改革探索与实践
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
无人机在铁路工程建设中的应用与思考