基于随机森林的门式起重机地震易损性分析*

2023-03-15 02:55程文明彭奇慧
起重运输机械 2023年1期
关键词:易损性特征参数震动

杨 冲 程文明 彭奇慧

1西南交通大学机械工程学院 成都 610031 2轨道交通运维技术与装备四川省重点实验室 成都 610031

0 引言

随着铁路、港口以及交通运输业的不断发展,门式起重机作为主要的货物装卸设备发挥着越来越重要作用,对起重机运输性能的要求也越来越高[1]。为了实现物料搬运的机械化,各种大跨度、大起重量的起重机械应运而生,极大地提高了各国各地区之间的经济贸易水平,但同时也对其抵御自然灾害的能力提出了更加严苛的要求。因此,对震后起重机损坏状态的评估预测是非常重要的,只有正确地评估起重机的损坏状态,才能判断该起重机是否能够用于震后救援和灾区重建等工作。

近年来,随着机器学习算法的发展与成熟,其在地震工程中的应用也成为当今研究的热点。机器学习属于人工智能的子领域,是数据科学与计算机科学相关的交叉学科[2],其目标是从已有数据中通过一定的学习算法获取知识和规律,从而对未发生的事件进行预测。杨强[3]提出了基于支持向量机和随机森林的RC框架结构震后安全状态评估方法;Mangalathu S等[4]提出了一种基于机器学习算法技术快速评估桥梁损伤状态的方法,其准确率可达73%~82%;鲁冠亚等[5]提出由随机森林模型建立桥墩地震易损性的方法;Luo H等[6]使用支持向量机算法研究了钢筋混凝土框架结构的地震易损性。综上可知,机器学习算法已经应用于结构地震易损性分析领域,且在钢框架和桥梁结构应用较广。

机器学习算法的准确率在一定程度上依赖于数据集的大小以及特征参数的选择,为了得到大量的结构地震响应数据,本文采用增量动力分析(Incremental Dynamic Analysis,IDA)方法[7],该方法是一种用于评价结构抗震性能的动力参数分析方法[8],其基本做法是将每一条地震动记录都按一定的比例系数调整为多重强度水平,再对结构施加调整后的地震动记录,分别在每一强度水平下进行时程分析。

机器学习大量地应用于建筑与桥梁等结构的抗震研究中,但在起重机抗震领域的研究较少。随机森林分为分类和回归2种方法,分类是将结果归为一个个的类别,然后判定预测的类别,而回归则是直接预测值,相较于分类得到的结果更直观,故本文选择了随机森林回归这种有监督的机器学习方法。

本文以门式起重机为例,通过Ansys建立有限元模型,利用Ansys的瞬态动力学分析模块对门式起重机进行地震分析,并选择合适的特征参数,建立机器学习需要的数据集。然后,建立随机森林回归模型,通过模型来对起重机结构震后状态进行预测,可准确地预测结构在不同地震强度下的结构损伤状态,避免人为经验判断的局限性。本文通过对机器学习模型的调参,不断地完善模型。此外,还研究了特征参数对于机器学习模型准确率的相对重要性。最后将预测易损性曲线和实际易损性曲线对比研究。

1 随机森林

随机森林(Random Forest Regressor)属于Bagging类算法,而Bagging又属于集成学习方法的一种[9]。随机森林回归是在生成众多回归树的过程中,通过对建模数据集的样本观测和特征变量分别进行随机抽样,每次抽样结果均生成一棵树,且每棵树都会生成符合自身属性的规则和判断值,随机森林回归则是集成所有回归树的规则和判断值,实现随机森林算法的回归。简单来说,随机森林回归就是多个决策回归树的综合结果。

1.1 决策回归树

决策回归树是一种非参数的有监督学习方法,回归树就是用树模型做回归问题,主要用于连续型变量。假设X、Y分别为输入和输出变量,且Y是连续变量。给定训练数据集D= {(x1,y1),(x2,y2),…,(xn,yn)},其中yi是一个m维的向量,即yi含有m个特征。回归问题的目标就是构造一个函数f(x)能够拟合数据集D中的元素,使均方误差(Mean Square Error,MSE)最小,即

式中:N为样本数量;i是每一个数据样本,是模型回归输出的数值,是样本点实际的数值。

由此可知,MSE的本质就是样本真实数据与回归结果的差异,本文采用回归树的接口Score返回的R2作为衡量回归树回归质量的指标。R2的定义为

式中:u为残差平方和MSE*N,v为总平方和,N为样本数量,i为每一个数据样本,f(xi)为模型回归出的数值,yi为样本点i实际的数值,为真实数值标签的平均数。

根据随机森林回归与单一的决策回归树关系可知,随机森林回归的接口Score返回的值仍为R2作为衡量随机森林回归的回归质量指标。随机森林回归相对于单一的决策回归树,由于采用了随机抽样,训练出的模型方差较小,泛化能力强;节点划分特征可以随机抽取,且模型的训练并行化,能大大提高模型的训练效率。

2 机器学习前期准备工作

2.1 建立数据集

门式起重机主要结构由门架、起升机构、小车架、大车行走机构以及电气设备等组成,本文主要研究的是门架结构在震后的损伤状态,门架结构的主要参数见表1。

表1 门架结构主要参数表

利用Ansys建立有限元模型,如图1所示。为了充分考虑地震动对于门架金属结构的影响,选取合适的地震动记录在地震分析过程中非常重要。本文依据GB 50011—2010《建筑抗震设计规范》[10]和起重机结构所在场地生成标准反应谱,从太平洋地震工程研究中心(PEER)筛选出110条与标准反应谱拟合程度较好的地震动记录。

图1 门式起重机有限元模型

在IDA分析中,地震动强度指标选用地震动峰值加速度(PGA)并对PGA进行等距调幅,PGA从0.1g增至1.0g,步长为0.1,共10种情况(0.1g、0.2g、0.3g、0.4g、0.5g、0.6g、0.7g、0.8g、0.9g、1.0g)。此外,本文将起重机主梁的下挠值作为起重机损伤状态的评估指标,再利用Ansys瞬态动力学分析模块得到1 100组起重机地震作用下的损伤数据。

2.2 特征选择和数据预处理

特征参数的选择是机器学习中至关重要的环节,有的特征对于预测结果的影响微乎其微,而有的特征对于机器学习模型的预测结果起着关键性的作用,故本文将对输入特征的相关重要性进行分析。利用Ansys对模型进行模态分析,得到前10阶模态频率,求得周期值。此外,根据相关研究以及本文的研究实际选择了6个特定周期值,最终选择了16个特定周期(T=0.1 s、0.14 s、0.18 s、0.2 s、0.27 s、0.4 s、0.46 s、0.57 s、0.75 s、1 s、1.5 s、2 s、3 s、4 s、5 s、6 s)对应的反应谱加速度值、平均反应谱(Savg)、以及20个地震动特征,共计37个特征,其中20个地震动特征见表2。

表2 地震动特征表

为了提高随机森林回归模型的性能,需要对初始数据集的数据进行预处理;为了减少数据的非线性,需要对数据进行对数化。此外,不同特征参数的数据具有不同的数量级,2个不同特征参数的数值可能达到了3个甚至3个以上的数量级差,这样就有可能会导致机器学习方法对个别特征的敏感度降低[11]。为了避免这类问题发生,还需要标准化数据集,使特征参数服从正态分布,经过预处理的数据输入到随机森林回归模型中即可达到更好的效果。

2.3 随机森林回归模型调参

对于随机林回归模型,还需要对模型的相关参数进行调优。可以调优的参数有基决策树的个数、树的深度(Max_Depth)、叶子节点最少样本数和节点再划分所需最小样本数等。一般只需要调整基决策树和树的深度2个参数,其他参数的调整对模型的效果不明显。

本文通过学习曲线来确定使模型达到最优解时参数的取值。首先将基决策树个数的取值通过学习曲线遍历了1~191、间隔为10的所有取值,其结果如图2所示。由图2可知,当基决策树的取值大于50,随着基决策树个数的增加,学习曲线的变化不明显,甚至还会有下降的趋势。

图2 基决策树取值(1~191)曲线图

图2是取间隔为10,遍历1~191的值得到的结果,故需取间隔为1。再次遍历10~50的所有取值,可得到模型最优解是的具体参数取值,其结果如图3所示。由图3可知,当基决策树个数取31时,随机森林回归模型评价指标R2可取最大值,最大值为0.852。

图3 基决策树取值(10~50)曲线图

同理,再次通过学习曲线对参数Max_Depth调优。本次选择遍历1~35的所有取值,其结果如图4所示。由图4可知,当参数取值23时,模型可得到的最大R2值为0.854。通过对Max_Depth的调参,R2的值提高了0.002。在机器学习调参过程中,R2提高0.002应是较好调优结果。

图4 Max_Depth取值(1~35)曲线图

3 随机森林回归模型分析

3.1 特征重要性评估

随机森林回归模型是基于均方误差(MSE)评估特征重要性,即如果特征参数使得均方误差越小,则说明此特征参数越重要。通过对特征重要性的评估,可以更好地验证模型的准确性,还可以通过重点关注重要特征参数来改进模型,可以删除无关紧要的特征,以减少计算工作量。图5列举了随机森林回归模型中排前10的特征参数及其权重值。

图5 排前10的特征重要性曲线图

由图5可知,排在第1位的是累计绝对速度(CAV),其相对重要性达到了17.8%,排在第2~第4位的是TPGV、TPGA和T=1 s时的反应谱加速度值,其相对重要性分别为11.83%、9.57%和6.9%。从总体上看,除了排在第1的CAV相对于其他特征占有较小优势,其他特征的相对重要性并未出现较大落差。在排名前10的特征参数中,峰值速度、峰值加速度和峰值位移对应的时刻均在其中,且TPGV和TPGA排在前列,而与反应谱加速度相关的有3个。值得注意的是,前10位特征参数的重要性之和达到了70.82%,说明未列举出的其余27个特征参数相对重要性只有29.18%。说明相对于靠前的特征参数来说,靠后的特征参数对于模型的影响微乎其微。

3.2 结构易损性曲线

地震易损性分析是一种物理分析方法,指结构易于受到地震作用下的破坏、伤害或损伤的可能性,即结构在地震不同等级下的失效概率。门式起重机结构的地震易损性函数表达式为

式中:D为地震需求反应,C为结构抗震能力,IM为地震动强度参数。

根据文献[12]可得到基于IDA分析的地震易损性函数表达式为

式中:MC为门式起重机结构损伤指标,MD、βD为结构地震需求函数D在条件地震动参数为IM的地震动作用下的条件中位值和条件对数标准差。

由前述可知,本文地震动强度参数为PGA,将在地震作用下门式起重机是否能达到A7工作级别作为结构的地震需求参数[13]。由GB/T 3811—2008《起重机设计规范》[14]可知,A7级别的起重机在满载工况下的主梁下挠值f需满足f≤L/1 000,L为主梁跨度。已知主梁跨度为35 m,在不同地震动强度作用下,当起重机主梁下挠值超过35 mm时,起重机不能满足A7工作级别[15]。易损性曲线如图6所示。

图6 预测易损性曲线与实际易损性曲线图

由图6可知,当PGA小于0.4g时,预测概率曲线和实际概率曲线的重合度很高;而PGA在0.4g~0.7g时,随机森林预测概率和实际概率拟合较差,且在此强度范围下,2条曲线上升坡度较大;当PGA大于0.7g后,实际概率曲线和预测概率曲线也表现出良好的拟合度。总体上看,2条曲线拟合程度较好,在上升区段有较为明显的差异。

4 结论

1)随机森林回归模型的效果较好。在对重要参数调优后,随机森林回归模型的R2值达到了0.854,可利用此模型进行后续研究。

2)峰值速度、峰值加速度和峰值位移对应时刻的相对重要性排名均在前10,且排名靠前。除此之外,特征周期T=1 s、0.2 s、0.18 s时的反应谱加速度值也在其中。由此可知,峰值时刻和特征周期对应的反应谱加速度值对于模型的预测结果影响较大。

3)从总体上看,随机森林回归模型很好地预测了易损性曲线,与实际易损性曲线的拟合度较高。虽然在易损性曲线上升区段拟合较差,但在可接受范围内。

猜你喜欢
易损性特征参数震动
冕洞特征参数与地磁暴强度及发生时间统计
震动减脂仪可以减肥?
画与理
基于IDA的预应力混凝土连续梁桥易损性分析
基于交通特征参数预测的高速公路新型车检器布设方案研究
桥梁地震易损性分析的研究现状
振动搅拌 震动创新
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
基于PSDM和IDA法的深水隔震桥梁地震易损性分析比较