基于可解释机器学习方法的RC深受弯构件开裂剪力预测∗

2023-10-10 07:21马财龙王文虎侯宪龙谢晨曦鲁成凤
关键词:筋率剪力宽度

马财龙,王文虎,侯宪龙,谢晨曦,鲁成凤

(1.新疆大学建筑工程学院,新疆 乌鲁木齐 830017;2.新疆大学新疆建筑结构与抗震重点实验室,新疆 乌鲁木齐 830017)

0 引言

我国规范将跨高比小于5的钢筋混凝土梁定义为深受弯构件[1].RC深受弯构件广泛应用于土木工程结构中,如高层建筑中的厚板转换层、地铁隧道里的厚顶板和地基基础中的厚条基等[2].RC深受弯构件在地震作用下的损伤特性将直接影响钢筋混凝土结构的抗震性能.RC深受弯构件以受剪为主,受剪破坏过程伴随斜裂缝产生发展至最终脆性破坏,准确预测开裂荷载及剪力对RC深受弯构件设计及安全性具有重要意义.

开裂荷载是深受弯构件受剪开裂性能的重要指标.国内外学者对于开裂荷载的认识不统一.Tan等[3]将出现首条斜裂缝或剪跨区斜裂缝高度超过梁高一半时的荷载称为开裂荷载.Birrcher等[4]将所测得箍筋应变突然增加时对应的荷载定义为开裂荷载.有学者将出现首条斜裂缝定义为开裂荷载[5-8].开裂荷载所对应的剪力为开裂剪力.已有研究表明开裂剪力与混凝土抗压强度、剪跨比、截面尺寸、纵向配筋率有关,并基于试验数据提出了众多半经验半理论计算模型[9-17].但由于回归公式形式和关键参数的差异,导致开裂剪力计算模型各不相同且预测精度低、离散性大.进一步探索RC深受弯构件的开裂剪力精准预测模型是十分必要的.

随着大数据时代的到来和人工智能的兴起,以“数据驱动”建模的机器学习方法擅长挖掘数据,可消除半经验半理论公式由于依赖数据回归带来的差异性.各种机器学习方法已广泛应用于混凝土构件基本性能的预测[18-24].Solhmirzaei等[18]采用机器学习单一算法预测了高性能混凝土梁的破坏模式和受剪承载力.Olalusi等[19]采用随机森林算法预测了钢纤维梁的受剪承载力.冯德成等[20,24]采用集成算法预测了不同构件的基本性能,如RC柱塑性铰长度等.于晓辉等[21]基于机器学习方法提出了RC柱的破坏模式两阶段判别方法.上述研究表明,机器学习方法预测RC结构的基本性能具有特有的优势.尤其是Lundberg和Lee[22]提出了机器学习模型的可解释方法:SHAP(SHapley Additive exPlanations).SHAP方法可得到各特征的重要性排序以及分析各特征对模型预测结果的贡献,克服了无法对机器学习模型的预测结果进行解释的问题,即“黑匣子”问题.近年来,SHAP方法也得到广泛应用.Mangalathu等[23]采用SHAP方法解释了剪力墙的破坏模式预测结果.冯德成等[24]采用SHAP方法解释了混凝土矮墙的受剪承载力预测结果.综上,关于钢筋混凝土深受弯构件开裂荷载及剪力相关的研究未见报道.

鉴于此,本文建立了RC深受弯构件开裂剪力的可解释机器学习模型.采用SHAP方法对机器学习模型预测结果进行解释.给出了预测RC深受弯构件开裂剪力的基本步骤,然后利用276条试验数据建立机器学习模型,利用统计指标将所建立模型与半经验半理论计算方法进行对比分析,最后采用SHAP方法对预测结果进行全局解释和局部解释.

1 RC深受弯构件的开裂剪力

通过对比学者们对开裂荷载的定义[3-8],本文采用Tan等[3]定义的开裂荷载.开裂荷载所对应的剪力为开裂剪力.下一章节介绍的所搜集的试验开裂荷载均是此含义.

RC深受弯构件的斜向开裂剪力受多种因素影响.剪跨比和跨高比决定了RC深受弯构件的开裂剪力.混凝土抗拉强度与骨料的最大粒径影响混凝土压杆的强度.加载板宽度是试件受力时与外荷载接触的关键组件,其影响了剪力的传递路径.另外,RC深受弯构件在正常服役期间,当弯曲裂缝出现后、斜裂缝出现前,底部纵筋起到抗剪及抗弯的作用.底部纵筋配筋率越大、纵筋的直径越小,裂缝扩展得越慢,开裂剪力随之增加.随着外荷载的增加,支座处垂直于梁长方向的弯曲裂缝迅速向加载点延伸,此时剪跨区出现斜向裂缝,与斜裂缝相交的腹筋应力显著增大,腹筋配筋率越大、腹筋的直径越小、腹筋间距越小,斜向裂缝扩展得越慢.

已有开裂剪力计算方法大多是基于试验数据回归的半经验半理论公式[9-17],计算方法如下.

1)南京工学院所提计算模型[13]:

2)郑州工学院所提计算模型[14]:

3)徐积善团队所提计算模型[15]:

4)彭天明所提计算模型[16]:

5)李朋团队所提计算模型[17]:

式中:λ为剪跨比,ft为混凝土抗拉强度,b为截面宽度,h0为截面有效高度,a为剪跨,ρl为纵筋配筋率.已有的计算方法与剪跨比、混凝土抗拉强度、截面宽度、截面有效高度和纵筋配筋率有关,尚未考虑混凝土骨料的最大粒径、跨高比、底部纵筋的直径、腹筋的影响.

综合上述讨论与分析,明确了建立机器学习模型时的拟输入参数:加载板宽度、截面宽度、有效高度、剪跨比、跨高比、混凝土抗压强度、底部纵筋配筋率、水平腹筋配筋率、竖向腹筋配筋率、混凝土的最大粒径、腹筋的最大间距和最小直径.

2 数据库

为建立机器学习模型,从27篇文献[5,25-50]中收集了276条含开裂荷载信息的受剪破坏的RC深受弯构件.试验数据库中共有109根无腹筋试件、167根双向腹筋试件.所收集的试验数据库包含的变量有开裂剪力(Vcr)、截面宽度(b)、加载板宽度(lp)、有效高度(h0)、剪跨比(a/h0)、跨高比(l0/h)、混凝土抗压强度(f′c)、底部纵筋配筋率(ρl)、水平腹筋配筋率(ρsh)、竖向腹筋配筋率(ρsv)、混凝土的最大粒径(ag)、腹筋的最大间距(smax)和最小直径(rmin).数据分布如图1所示,其中y轴为频数,表示参数的每个范围在数据集中出现的次数,详细的试验信息见原始文献.需要说明的是,图1(l)为机器学习目标预测值,其余均是模型特征输入参数.

图1 模型特征输入参数及目标预测值(标签)的分布

3 基于机器学习建立预测模型

3.1 XGBoost集成学习算法

RC深受弯构件开裂剪力的预测,主要属于机器学习中的回归类问题.目前,常用于解决回归类问题的机器学习算法主要包括回归算法、决策树[51]、支持向量机[52]、集成学习算法bagging[53]、集成学习算法boosting[54-55]和人工神经网络[56]等.集成学习算法boosting中的极端梯度提升树(XGBoost)[57]性能优势突出,增加了正则化项,控制了模型的复杂度,在保证预测结果准确性的同时避免了过拟合问题[24].Feng等[20]的研究结果表明XGBoost预测混凝土构件的基本性能时在众多常见集成算法中具有较好的性能,因此,本文选用XGBoost对RC深受弯构件的开裂剪力进行预测.

3.2 SHAP方法

SHAP[22]是基于博弈论的用于解释机器学习模型的方法,其是将预测目标定义为输入特征线性相加的加性特征归因方法,描述各个特征对模型预测结果的贡献,可表示为:

式中:X=(x1,x2,···,xM)为输入特征,X′=h(X)=(x′1,x′2,···,)为X映射后的简化输入(x′i∈[0,1]),M为输入特征个数,f(X)为原始机器学习模型,g(X′)为解释模型,φ0为f(X)在数据集上的平均预测结果,φi为第i个特征的SHAP值(表示贡献).以5个输入特征为例,SHAP示意图如图2所示;其中:特征1、2、3对于g(X′)为正值贡献,特征4、5对于g(X′)为负值贡献.

图2 多特征SHAP示意图[22]

SHAP方法主要分为Kernel SHAP、Deep SHAP和Tree SHAP.其中Tree SHAP是基于树模型的解释方法,适用于决策树、集成学习算法bagging的代表随机森林、集成学习算法boosting的代表XGBoost等多种性能较好的算法.本文也将采用Tree SHAP方法对机器学习模型进行解释.

3.3 所建立模型的流程

RC深受弯构件开裂剪力的可解释机器学习预测模型建立流程如图3所示.先将数据库中所有数据进行标准化处理.然后按照总数据70%和30%的比例随机划分成训练集和测试集.最后将数据带入XGBoost算法生成模型,为了提高模型的性能,采用网格搜索技术和十折交叉验证(CV)的方法确定最优参数.本文确定的最优关键参数为:n_estimators=150、max_depth=3、learning_rate=0.3.对于回归类模型,主要评价指标包括可决系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE),详见式(7∼10).式中:Ti表示试验值,Pi表示模型的预测值(i=1,2,···),n表示样本的数量.

图3 可解释机器学习模型建模过程

3.4 机器学习模型与已有计算方法预测结果

XGBoost模型与第1节提到的5个开裂剪力计算方法的预测结果如图4所示.RC深受弯构件分为无腹筋构件和双向腹筋构件以比较已有计算方法预测效果.图4(a)为XGBoost模型的预测结果,图4(b∼f)为已有计算方法的预测结果.图4(a)中红色方块为训练集数据,蓝色圆点为测试集数据;图4(b∼f)中蓝色圆点为双向腹筋深受弯构件,橙色方块为无腹筋深受弯构件.表1列出了已有计算模型和XGBoost模型预测值/真实值的相关统计数据.

表1 已有计算模型与XGBoost模型预测结果的统计指标

图4 半经验半理论公式与XGBoost模型的开裂剪力预测结果

1)已有计算模型仅考虑了剪跨比、混凝土抗拉强度、有效高度、截面宽度4个参数,而XGBoost模型考虑了11个输入参数的影响;2)XGBoost模型采用276条试件数据进行建模,避免了模型过拟合;3)XGBoost模型在损失函数中增加了正则化项,提高了模型精度;综上,XGBoost模型性能优于已有计算模型.结合图4和表1可知,已有计算模型的预测结果离散性较大,且散点大多落于y=x斜直线的上方区域,特别是预测配有双向腹筋的深受弯构件时.说明已有计算模型普遍高估了开裂剪力.已有计算模型预测效果最好的是徐积善团队所提的公式[15],预测结果的R2为0.64,预测值与试验值比值的均值为1.06,标准差为0.53.由XGBoost模型预测结果的散点图可知,散点大多落于y=x斜直线上,且较为集中,说明XGBoost模型的预测结果更为接近试验值.XGBoost模型的统计指标也表明预测效果远优于已有计算模型,其预测值与试验值比值的均值为0.99,标准差为0.27.

4 XGBoost模型预测结果的解释

本节将在前一节预测结果的基础上,采用SHAP方法对模型的预测结果进行解释.首先对数据库内所有试件进行全局解释,依次分析了关键特征重要性排序和关键特性依赖关系.然后对数据库的单一样本进行局部解释,分解了每个输入变量对RC深受弯构件开裂剪力的贡献值,量化了每个输入变量对开裂剪力的贡献程度.需要说明的是,先获得了特征重要性排序及SHAP值分布,然后是特征依赖图,最后是单一样本模型的预测结果.

4.1 全局解释

4.1.1 特征重要性分析

特征重要性分析是解释模型预测结果最常用的方法,它直接显示了每个特征对最终预测的影响程度,特征对模型预测的影响程度越大,该特征就越重要.图5(a)给出了XGBoost模型对开裂剪力的相对特征重要性结果,可知加载板宽度是最重要的特征,因为加载板宽度的平均绝对SHAP值最大.截面高度是第二重要特征,其重要性仅次于加载板宽度.而混凝土抗压强度、纵筋配筋率和腹筋最小直径是第三重要特征,其平均绝对SHAP值约是加载板宽度的1/3.腹筋最大间距、截面宽度和剪跨比对结果的影响约为加载板宽度的1/5.腹板和纵筋的配筋与钢筋强度的重要性仅占混凝土抗压强度的1/10左右.其余特征对结果的影响相对较小.图5(b)展示了每个特征变量对预测结果的影响趋势,按照SHAP的平均绝对值进行特征排序.

图5 SHAP值全局模型解释

图5中的x轴表示SHAP值大小,SHAP值蓝色代表该特征对预测有负向影响(箭头向左,SHAP值减少),红色代表该特征对预测有正向影响(箭头向右,SHAP值增加).左侧y轴表示输入的特征变量;右侧y轴的颜色条表示特征值的大小,红色表示特征值高,蓝色表示特征值低.每个散点表示数据库中的一个样本.因此可展现每个特征变量对预测结果是如何影响的,以及特征的重要性.比如,对于加载板宽度,其样本大量聚集shap value为负的区域.加载板宽度的值越高,可能使模型的输出值越大(shap value为正);加载板宽度的值越低,可能使模型的输出值越小(shap value为负).故加载板宽度与模型的输出值成正相关;同理,截面高度、混凝土抗压强度、截面宽度均与模型的输出值成正相关,剪跨比与模型的输出值成负相关.

4.1.2 特征依赖性分析

SHAP特征依赖图可以用来反映SHAP值随着输入特征的变化而变化,在数学上包括x轴上的特征值和y轴上相应的SHAP值.它可以揭示输入特性如何影响预测值,以及这种影响是积极的还是消极的.开裂剪力的SHAP值随输入变量的变化如图6所示.可知有效高度和混凝土抗压强度的SHAP值会随着特征值的增长而降低,当跨高比小于4.0时,其SHAP值几乎没有变化,水平腹筋配筋率的SHAP值变化无明显规律.另外,当剪跨比大于1.0、有效高度大于750 mm、混凝土抗压强度小于30 MPa、底部纵筋配筋率小于2.0%、水平腹筋配筋率小于0.50%时,它们的SHAP值为负值.也就是说,当各特征落于上述范围时,所预测的开裂剪力减小.还可观察到特征之间的交互关系,如图6(c)显示了水平腹筋配筋率从0到0.7%的变化对剪跨比的影响.红色的值代表变量水平腹筋配筋率的高值,而蓝色的值代表低值.由图6(c)可以发现,当剪跨比较大、水平腹筋配筋率较低时,SHAP值极低;可推断出有效高度与竖向腹筋配筋率之间的关系对特征的SHAP值的共同影响,当有效高度越小、竖向腹筋配筋率越低时,SHAP值越小.混凝土抗压强度和水平腹筋配筋率、底部纵筋配筋率和跨高比也呈现同样的上述规律.

图6 特征依赖图

4.2 局部解释

本文对Smith[25]和Walraven[27]等的试验结果进行单一样本模型解释,图7展示了SHAP值将开裂剪力的预测分解为每个输入变量的贡献之和.图7的“base value”表示基准值,即XGBoost模型对数据库内所有变量预测值的平均值(202.2 kN).红色箭头表示对基准开裂剪力有正向贡献的变量,蓝色箭头则表示导致基准开裂剪力降低的变量;箭头的长短表示增量和减量.对试件DB50/1.86-C1来说,截面宽度、加载板宽度、竖向腹筋屈服强度、截面有效高度、水平腹筋配筋率、水平腹筋屈服强度和跨高比是对基准开裂剪力有正向贡献的关键变量,它们的增量依次减小.其余变量(腹筋最大间距、纵筋屈服强度、腹筋的直径、底部纵筋配筋率和混凝土抗压强度)是导致基准开裂剪力降低的关键变量,它们的降低程度依次减小.将所有变量的增量或减量与基准开裂剪力进行代数相加,即为图中的模型预测值228.51 kN,与试验值240 kN接近.对试件A1.5-0.75-1.33来说,竖向腹筋屈服强度是对基准开裂剪力有正向贡献的量.其余变量如加载板宽度、截面宽度、混凝土抗压强度等是导致基准开裂剪力降低的变量,它们的减量依次降低.将所有变量的增量或减量与基准开裂剪力进行代数相加,即为模型预测值81.74 kN,接近试验值83.30 kN,且预测结果比试验值低,说明最终预测结果是精确且安全的.

图7 SHAP值单一样本模型解释

5 结论

本文提出了一个可解释机器学习模型来预测RC梁的开裂剪力.详细介绍了研究思路和方法.收集了包含276条试件的数据库来训练和测试XGBoost模型,然后与半经验半理论公式进行比较.最后利用特征重要性、特征依赖性分析、单一样本来解释和验证XGBoost模型.得出以下结论:

1)与5个半经验半理论公式相比,本文的XGBoost模型在预测精度和泛化能力方面有明显的优势.模型的R2为91%,预测值与试验值比值的均值为0.99,标准差为0.27.

2)通过特征重要性和特征依赖性分析,可以进一步了解输入参数对开裂剪力的作用.其中:加载板宽度是影响RC深受弯构件开裂剪力最重要的特征,截面高度是第二重要特征,混凝土抗压强度是第三重要特征.

3)通过对单一样本进行分析,表明了XGBoost模型预测结果是符合机理的.

本文详细介绍了建立ML预测模型的每一步,可以帮助读者使用ML解决自己在结构工程中的问题.然而,在该领域仍有进一步改进的空间,例如,使用主动学习来提高计算效率,开发基于ML的力学引导抗剪强度模型以更好地应用等.

猜你喜欢
筋率剪力宽度
结构构件经济配筋率分析
钢筋混凝土受弯构件配筋率影响因素及变化规律研究①
悬臂箱形截面梁的负剪力滞效应
考虑截面配筋的箱梁剪力滞效应分析
浅析剪力墙最小配筋率对结构安全性的影响
红细胞分布宽度与血栓的关系
孩子成长中,对宽度的追求更重要
箱型梁剪力滞效应的解耦求解
80m简支钢箱梁剪力滞系数研究
浅谈钢筋混凝土烟囱外筒设计