基于高斯过程机器学习的工程不确定性分析研究

2022-04-09 17:07鲁俊魏懿
机电工程技术 2022年2期
关键词:机器学习

鲁俊 魏懿

摘要:工程中不确定性对结构的设计和安全分析产生不可忽略的影响,不确定性的分析与处理逐渐成为科学和工程中所关心的重要问题。针对复杂动力学结构响应的特点,研究基于高斯过程机器学习的不确定性传播方法。首先对不确定性的来源和分类进行简单介绍,重点研究高斯过程机器学习的基本原理,最后通过算例研究说明两个数学测试函数和一个工程结构展示高斯随机过程的建模优势。

关键词:不确定性传递;概率方法;机器学习;高斯随机过程

中图分类号:TP181

文献标志码:A

文章编号:1009-9492 ( 2022)02-0055-04

0 引言

复杂工程结构系统的设计中,一般会涉及到大量不确定性因素。由于不确定性对结构的设计和安全分析产生有不可忽略的影响,不确定性的量化和传递分析逐渐成为科学和工程中关键问题之一。目前工程设计中,表示不确定性的主流工具为概率方法。为了进行不确定性的定量分析,需要首先建立不确定性的概率模型,收集大量样本数据。对于复杂模型,采用传统的不确定性传递方法无疑会使得计算量变得异常庞大。为加快重分析,基于数据驱动的机器学习技术可以代替复杂仿真模型以提高实际工程中的分析效率。

在机器学习领域,有监督学习与无监督学习是两种常见的方法。高斯过程是基于统计学习理论和贝叶斯理论发展起来的一种机器学习方、法[1]。这类方法也称为代理模型技术,属于机器学习中的有监督学习方法。通过现有训练数据集进行建模,再用模型对新的数据样本进行回归分析。至今这类方法已经越来越受到工程的广泛关注,并用于不同工程领域。在汽车防撞性优化设计中,Forsberg等[2]分别用到了多项式响应面和Kriging模型进行优化,展示了两种模型在不同优化问题中有各自优势。利用汽车正面碰撞模型,张宇[3]利用5种近似模型比较研究了代理模型在拟合车身碰撞加速度峰值、碰撞力峰值、最大吸能量以及最大变形量等响应。为比较拟合汽车正面碰撞中车体B柱加速度峰值响应的拟合能力,张勇等[4]研究了移动最小二乘模型和多项式模型。结果表明移动最小二乘的拟合精度明显高于多项式,且需要较少的迭代就可以收敛并得到最优解。臧献国等[5]采用多项式响应面法建立了设计变量与目标噪声值的学习模型,有效地验证了该方法的有效性。聂祚兴等[6]建立了汽车板件厚度与声压级响应均方根值和一阶扭转频率的多项式响应面模型,并利用响应面模型对结构进行优化。Li和Li-ang等[7]建立响应面模型进行了车身结构声辐射分析和优化,以获得振动声学特性最优结构参数组合。对封闭箱体的结构声学问题,Wang等[8]采用多项式响应面建立了阻尼层厚度与目标响应之间的函数关系,并对其进行了多目标优化。

本文针对复杂动力学结构响应的特点,研究基于高斯过程机器学习的不确定性传播方法。首先对不确定性来源和描述方法進行简单介绍,然后对代理模型的建模、验证、常用的代理模型方法进行总结归纳。详细阐述高斯过程机器学习的基本原理,最后通过数学测试算例展示高斯随机过程模型的建模优势。

1 结构不确定性分析理论和方法

1.1 不确定性来源和分类

实际复杂工程结构中几乎所有的设计变量和参数都带有一定的不确定性。不确定性主要来自模型与试验,包括以下几个方面。

(1)结构的参数不确定性(Parameter Uncertainty)。由于建模参数的设置存在误差或制造装配等导致结构的偏差,使得材料的杨氏模量、密度、构件的几何参数等未能准确获得,或者参数存在变异性。

(2)模型形式不确定性(Model Uncertainty)。由于结构仿真的理论模型假定的不精确及进行数学或力学建模过程中的不适当假设等引起数学模型与物理模型之间的模型偏差。

(3)算法不确定性(Algorithmic Uncertainty)。对复杂数学模型的求解,由于数值计算的近似导致数值上的误差,或使用不同数值求解算法得到不同的求解结果。如采用有限元方法或者差分法进行对偏微分方程求解存在一定的误差。

(4)试验的不确定性(Experimental Uncertainty),即观测误差。比如完全相同的重复实验产生不同实验结果。试验测试仪器的测试参数设置,试验环境不确定性因素和仪器自身误差导致的不确定性均属于试验不确定性。

根据不确定性属性及来源,不确定性主要分为两大类:偶然不确定性(Aleatory Uncertainty)与认知不确定性(Epistemic Uncertainty)。偶然不确定性,又称随机不确定性( Stochastic Uncertainty)或客观不确定性(Objec-tive Uncertainty),是指由偶然因素或随机性产生的不确定性;认知不确定性,又称主观不确定性(Subjective Un-certainty),是指由于缺乏知识或数据而产生的不确定性。1.2不确定性描述与传递

不确定性的数学描述可以分为两大类:概率方法和非概率方法。概率方法是物理系统中用于表征不确定性最广泛的方法,主要用均值、方差、概率密度函数及累计分布函数来构建概率模型以描述不确定性。对于认知不确定性,通常数据量少,又没有足够的证据,无法用概率分布来描述不确定性,因此只能用非概率的方法来处理。非概率方法主要包括区间理论、模糊理论、概率边界和证据理论等。

不确定性量化与传递分析着重研究参数不确定性问题,即不确定性在输人参数和响应特征之间的传递。不确定性正向传递是指输人参数不确定性通过所建立的模型映射到模型输出,进而得到响应特征不确定性的统计影响。不确定逆向传递是指由响应特征的不确定性找到输入参数不确定性,即通过输出响应的不确定性来识别输入不确定的过程,属于结构分析的逆问题。

不确定性量化与传递分析着重研究参数不确定性问题,即不确定性在输入参数和响应特征之间的传递。不确定性正向传递是指输入参数不确定性通过所建立的模型映射到模型输出,进而得到响应特征不确定性的统计影响。不确定逆向传递是指由响应特征的不确定性找到输入参数不确定性,即通过输出响应的不确定性来识别输入不确定的过程,属于结构分析的逆问题。

2 高斯随机过程模型建模方法

基于代理模型的机器学习技术进行不确定性传递的原理简单,关键在于如何通过训练数据集构建预测模型,并保证预测模型的精度和效率。考虑到高斯过程机器模型在全局估计和局部估计两方面都表现出良好的特性,对非线性问题的近似能力较好,本文将主要研究高斯随机过程模型[9-10]。下面对它的基本原理及建模方法进行简单介绍。

可以看出,CP模型不仅仅是对预测值的均值进行了描述,还对预测值的分布进行了分析。通过预测值的均值以及方差,可以方便地对预测值的置信区间进行分析,有效地对待测点处的模型拟合不确定性进行估计。值得注意的是,GP模型的构建主要困难在于超参数的最大似然估计,即如何有效获得最佳的超参数组合。为了获得超参数,通常需要采用数值优化算法求解超参数的最大似然函数最大化问题[11]。

3 数值算例研究

3.1 非线性测试函数

图1所示为Branin-Hoo函数[12]的等高线。由于Bra-nin-Hoo函数在设计空间内不同位置处存在3个局部最优解,表现强非线性。本文将利用该算例分别测试多项式响应面模型、多元自适应样条回归模型、径向基函数模型和高斯随机过程模型的预测能力。为了对比,选用30个相同的拉丁超立方训练样本,使用不同近似模型对Branin-Hoo函数进行近似。如图2所示,可以看出,相同训练样本下,几种代理模型预测误差相差较大。本文建立的高斯随机过程模型精度最高,预测误差R2=0.9997,RMSE=0.017 5,在整个设计空间内对目标函数具有较好的近似。

3.2 帶噪声的测试函数

真实的物理实验数据无可避免存在测量误差。本算例给数学仿真数据添加εEN(0,σ2)的随机观测误差,以验证高斯随机过程模型对噪声数据的预测能力。图3 (a)和图3 (b)分别为在较小和较大噪声方差下的预测结果。从图中可以看出,即使在较大的噪声方差下,高斯随机过程模型仍然能较好地近似真实响应。同时该算例较好地证明了本文高斯随机过程建模方法的正确性。

3.3 工程桁架结构

图4所示为带有23个构件的工程桁架结构[13],共10个随机变量。假设所有水平构件的杨氏模量和横截面积相同,对角构件为另一种杨氏模量和横截面积。要求计算图中观测点处的变形位移(挠度)超过0.11 m的失效概率。已有数据分为两部分:实验设计得到的200个训练样本和10 000个蒙特卡洛验证样本。真实响应通过有限元软件ANSYS得到。

通过200个实验设计样本对高斯随机过程模型进行拟合,然后将预测结果与真实响应进行对比,如图5所示。可以明显看出,基于有限元模型与基于高斯随机过程模型的预测响应几乎完全一致。预测误差R2= 1.00,RMSE=6.26x10 -5,说明建立好的高斯随机过程学习模型可以很好地代替原模型进行不确定性传递分析。图6所示为两种方法得到的概率密度函数对比。可以看出,两种方法的结果几乎相同,说明基于高斯过程学习模型的不确定性传递方法精度较高。由于基于原有限元模型的蒙特卡洛分析计算量大,这类不确定性分析几乎无法在工程中广泛使用,而基于代理模型机器学习的方法可以在保证精度的条件下,大大节省运算时间,提高效率。

4 结束语

本文对不确定性分析理论与描述方法进行了介绍,重点研究了高斯过程机器学习及其在不确定性传递研究中的应用。通过数值实例发现,基于高斯过程机器学习的不确定性分析方法结合了基于样本的不确定性传递方法和高斯随机过程模型技术各白的优点,在保证精度的前提下,明显降低了计算量。相对于传统的有限元仿真模型,高斯过程机器学习具有计算效率高和重复性强的特点,可以较好地协助工程人员完成大型结构和多变量复杂结构的不确定性分析。

参考文献:

[1] Rasmussen C E.Williams C.Gaussian Processes for MachineLearning[M]. MIT Press. 2005.

[2] Forsberg J, Nilsson L.On polynomial response surfaces and Krig-ing for use in structural optimization of crashworthiness[J]. Struc-tural& Multidisciplinary Optimization. 2005. 29(3): 232-243.

[3]张宇.基于稳健与可靠性优化设计的轿车车身轻量化研究[D].上海:上海交通大学,2009.

[4]张勇,李光耀,钟志华.基于移动最小二乘响应面方法的整车轻量化设计优化[J].机械工程学报,2008, 44(11): 198-202.

[5]臧献国,于德介,姚凌云,响应表面法在结构噪声优化中的应用研究[J].噪声与振动控制。2009. 29(4):116-119.

[6]聂祚兴,车身噪声传递函数的全局灵敏度分析及稳健优化设计[D].长沙:湖南大学,2012.

[7] Li Z,Liang X.Vibro-acoustic analysis and optimization of damp-ing structure with Response Surface Method[J]. Materials&de-sign, 2007, 28(7): 1999-2007.

[8] Wang Y,Qin X, Huang S,et al. Structural-bome acoustics analy-sis and multi-objective optimization by using panel acoustic par-ticipation and response surface methodology[J].Applied Acous-tics.2017 (116):139-151.

[9]陈世适.基于多源响应信息融合的优化设计理论与方法研究[D].北京:北京理工大学,2016.

[10]鲁俊.基于近似模型的结构动力学不确定性传递及其降低研究[D].重庆 :重庆大学. 2020.

[11] Bostanabad R. Keamey T, Tao S, et al. Leveraging the nuggetparameter for efficient Caussian process modeling[J]. Intema-tional Journal for Numerical Methods in Engineering, 2017 (5):501-516.

[12] Picheny V, Wagner T, Ginsbourger D. A benchmark of kriging-based infill criteria for noisy optimization[J]. Structural and Mul-tidisciplinary Optimization, 2013, 48(3): 607-626.

[13] Lee S H. Kwak B M. Response surface augmented momentmethod for efficient reliability analysis[J]. Structural safety.2006. 28(3): 261-272.

猜你喜欢
机器学习
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
下一代广播电视网中“人工智能”的应用
基于支持向量机的金融数据分析研究
基于Spark的大数据计算模型
基于朴素贝叶斯算法的垃圾短信智能识别系统
基于图的半监督学习方法综述
机器学习理论在高中自主学习中的应用
极限学习机在图像分割中的应用