基于分位数回归的幂多项式在数据分析中的应用

2017-02-09 03:08王江荣袁维红任泰明
测绘工程 2017年4期
关键词:位数回归方程位点

王江荣,袁维红,赵 睿,任泰明

(1.兰州石化职业技术学院 信息处理与控制工程系,甘肃 兰州 730060;2.兰州石化职业技术学院 土木工程系,甘肃 兰州 730060)

基于分位数回归的幂多项式在数据分析中的应用

王江荣1,袁维红2,赵 睿1,任泰明1

(1.兰州石化职业技术学院 信息处理与控制工程系,甘肃 兰州 730060;2.兰州石化职业技术学院 土木工程系,甘肃 兰州 730060)

针对路基沉降与观测时间存在非线性关系,且传统最小二乘参数估计精度不高的问题,建立具有较强逼近能力的幂多项式路基沉降预测模型,并用分位数回归估算模型系数。工程实例表明,基于分位数回归估计的幂多项式预测模型具有较高的精确度,优于最小二乘估计的幂多项式预测模型和多变量灰色预测模型,为沉降预测提供一种新方法。

高速公路;路基沉降;幂多项式函数;分位数回归;沉降量预测

高速公路在施工期和工后运营期均存在着路基沉降问题,利用现场沉降观测量准确预测后期沉降量,对于公路施工质量监管、道路安全、公路维护等具有重要的实现意义,同时为公路管理等部门提供科学的决策依据。现有的沉降预测方法主要采用回归分析模型、统计模型、组合模型[1-5]、神经网络[6]和灰色理论[7]等,这些模型的参数估计大多采用了最小二乘估计法,该估计法要求模型的随机误差服从独立同分布且呈正态分布,但在实际沉降问题中,受多因素影响[8-9],估算出的参数并非最优,得到的模型稳健性较差,预测精度不高。与传统最小二乘回归相比,分位数回归是一种非常稳健的参数估计方法[10-12],模型参数的估计结果不会受异常观测数据的影响,且对模型的随机误差项无任何要求,克服了最小二乘估计法的不足。另外,用最小二乘法建模时只能得到一个回归方程,容易丢失数据信息,致使所建模型难以对预测量进行准确预测;用分位数回归估算模型参数时在不同分位点上估算出的模型参数往往不同,因而可以得到多个不同的回归方程,从而在不同的分位点上预测结果不同,为决策者提供了多种选择,以便选出符合实际的回归方程。由于沉降观测数据列具有非线性特征,而幂多项式函数具有良好的数据适应能力和实际曲线逼近能力。基于此,本文建立基于分位回归估计的幂多项式模型,并对建模以外的路基沉降观测量进行预测分析,结果表明该模型具有较强的预测能力和更高预测精确度。

1 分位数回归方法介绍

分位数回归方法最早由Koenker和Bassett提出[13],该方法是一种全面数据分析方法,具有很强的抗干扰能力和稳健性。

设FY|X(y)为在随机变量X下Y的条件分布函数,则Y的第τ∈(0,1)个条件分位数为

(1)

其中,inf(•)表示下确界函数。

(2)

式(2)的估计式等价式(3):

(3)

可见,分位数回归是通过最小化样本观测值与样本拟合值的加权误差绝对值之和来估算模型参数的;而传统最小二乘回归则是通过最小化误差平方和来估算模型参数值。

用分位数回归建模时得到不同分位点的回归

方程,决策者从中选择最能反映实际问题的回归方程,解决问题更具灵活性。

2 幂多项式模型

2.1 幂多项式模型及线性化

软基路基沉降的基本特征:初期阶段沉降逐渐增加,中期阶段沉降加速发展,后期阶段沉降变缓并趋近于一个定值(进入稳定状态)。因此,沉降量S与时间t呈非线性关系,进而知S-1与t-1也呈非线性关系。因多项式函数具有较强的数据适应能力和实际曲线逼近能力,所以可选用多项式函数对路基沉降量进行拟合预测。由于幂多项式对观测数据无过多要求,因此本文采用幂多项式来逼近S-1,即建立模型:

(4)

(5)

线性化后的模型(5)可方便地利用分位数回归估计其参数β0,β1,…,βn。

2.2 模型参数的分位数回归估计

依据分位数回归的基本原理,构造模型损失函数:

(6)

式中:m为建模数据列长度,

Si为第i个观测沉降量,则模型的参数估计值

3 算例分析

3.1 数据来源

数据源自京哈(G102线)软基公路长春至德惠路段的K1144+240断面上的某监测点,观测以15天为1个周期,所得观测数据见表1[15]。

表1 数据资料[15]

表1给出的数据资料中,等间隔(对非等间隔本文模型依然适用)的实际观测次数共12 次,在12个周期的累积沉降数据序列中取1~9次的沉降S-时间t数据估算模型的参数β0,β1,…,βn;取10~12次的沉降S-时间t数据来检验模型预测值的准确性。作出1~9次的S-1-t-1的散点图,如图1所示。

图1 S-1-t-1关系图

图1表明S-1与t-1为非线性关系,可用以t-1为自变量的多项式逼近S-1,经线性化后用条件分位数估算模型参数。经分析比较选用4次幂多项式为拟合预测模型,即

(7)

从而

(8)

3.2 模型参数估计

利用Matlab2014a软件编写分位数回归法程序并结合表1中1~9次的沉降S-时间t数据来估算模型参数β0,β1,…,β4。这里选用5个不同分位点τ=0.1,0.3,0.5.0.7,0.9估计模型系数。由于数据量较少,计算时选择单纯性算法。通过计算,得到的估计结果见表2。

表2 不同分位点下模型系数的估计值

表3 不同分位点下模型的拟合优度值

表3中数据表明5个模型的拟合优度都比较高,说明回归的效果是显著的,可以用所建模型对后续沉降进行预测分析。τ=0.7时回归方程的拟合效果图如图2所示。

图2表明τ=0.7对应的回归方程拟合效果很好,其他分位点对应的回归方程拟合图略去。

3.3 预测分析

根据表2中的模型参数及式(8)得到τ=0.3,0.5,0.7时预测模型如下:

图2 分位点为0.7的回归方程拟合效果图

1)τ=0.3,

2)τ=0.5,

3)τ=0.7,

利用τ=0.1,0.3,0.5,0.7,0.9的模型对表1中序号10~12的测试数据进行预测分析,结果见表4。采用最小二乘回归法估算出的模型系数为(-0.034 612,22.788 91,-2 585.586,125 419.8,-203 562 7),对测试数据的预测值及误差见表4第3列。文献[15]的预测结果见表4最后一列。

表4 不同分位点对应的路基沉降量预测值 mm

从表4可以看出,基于分位数幂多项式模型对软基高速公路沉降量的预测精度高于基于最小二乘参数估计的幂多项式预测模型(误差绝对值之和的平均值为1.543 2),也高于文献[15]多变量灰色预测模型MGM(1,3)(误差绝对值之和的平均值为1.046 7),尤其以0.7分位数幂多项式模型的预测精度最高(误差绝对值之和的平均值为0.366 3)。因此,选取0.7分位数回归的幂多项式模型作为最终的预测模型。

文献[15]还提供了另外两个观测点上的12个数据,采用本文建模方法均取得理想效果,综合分析表明,将分位数回归用于路基沉降量预测分析完全可行,能够满足工程需要。

4 结束语

1)最小二乘估计只有在模型的随机误差项服从正态独立同分布时才能得出参数的无偏差估计,但在实际问题中这些条件往往难以满足,因而使参数估计值偏离理想值,导致模型精度下降。分位数回归估计拓展了最小二乘估计方法,按不同分位点可得多组估计量,从而得到多个回归方程,使得在进行沉降量预测时对预测模型有更多选择。由于分位数回归时对模型的随机误差项不做任何假设,同时具有很强的数据适应能力,对少量样本也能取得理想效果。

2)幂多项式模型结构简单,对数据质量要求不高,具有很好的数据逼近和拟合能力,且容易线性化,非常适合用分位数回归估算其参数。另外,利用Eviews软件和MATLAB软件可方便地完成幂多项式模型的建立和最终模型的选取。工程实例表明,基于分位数回归的幂多项式模型预测精度优于基于最小二乘估计的幂多项式模型,也优于多变量灰色时间序列模型MGM(1,3)的预测结果,为路基沉降数据分析研究提供一种新思路、新方法。

3)不同的分位点(可分为低分位和高分位)代表不同的路基沉降发展水平,按施工期和工后期的不同状态选择不同分位数下的预测模型,会更符合实际,效果会更佳,对此需要进一步研究。另外,幂多项式建模的通用性有待论证。

[1] 郑建国,王婷,张继文.黄土路基沉降量预测方法的研究[J].岩土力学,2010,31(1):321-326.

[2] 甄京山.曲线拟合法在软土路基沉降预测中的应用[J].公路交通科技,2012(11):195-197.

[3] 张涛,蔡国军,刘松玉.基于Weibull模型的软土路基沉降预测方法[J].岩土工程学报,2013,35(增2):212-216.

[4] 陈善雄,王星运,许锡昌,等.路基沉降预测的三点修正指数曲线法[J].岩土力学,2011(11):3355-3360.

[5] 陈威,唐德燕,张届.三点法-灰色GM(1,1)组合模型在铁路路基沉降预测中的应用[J].测绘科学,2015,40(7):37-40.

[6] 辛大鹏,田林亚,沈哲辉.小波分解AR-BP网络模型在大坝垂直位移预测中的应用 [J].测绘工程,2015,24(12):53-54.

[7] 卢辰龙,匡翠林,陈晓林,等.基于TLS的多变量灰色模型在大坝变形预报中的应用[J].测绘工程,2015,24(12):53-54,48-52.

[8] 崔晓如.高填方路基沉降变形分析与预测及其控制标准研究[D].长沙:长沙理工大学,2010.

[9] 梅源.湿陷性黄土高填方地基处理技术及稳定性试验研究[D].西安:西安建筑科技大学,2013.

[10] 陈雪蓉.复杂数据下分位数回归建模及其应用[D].昆明:云南大学,2012.

[11] 姜成飞.分位数回归方法综述[J].科技信息,2013(25):185,240.

[12] 彭良玉.分位数回归在时间序列中的应用[D].天津:天津大学,2010.

[13] PAREN E. Quantile Probability and Statistical Data Modeling[J].Statistical Science,2004,19(4):625-662.

[14] 朱志铎,周礼红.软土路基全过程沉降预测的Logistic 模型应用研究[J].岩土工程学报,2009,31(6):969-969.

[15] 向一鸣,吴辉.基于多变量灰色模型的路基沉降预测[J].交通科技,2013(5):58-60.

[16] 杨晓松,张双成.基于灰色二阶模型的深基坑变形监测分析[J].交通科技与经济,2015,17(6):122-124.

[17] 谢文国,高俊强,徐东风.时间序列在地铁隧道变形监测数据处理中的应用[J].交通科技与经济,2015,17(4):114-116.

[责任编辑:李铭娜]

本刊郑重声明

近来,在一些搜索引擎上,经常充斥一些假冒网站、机构及个人以《测绘工程》杂志社名义征稿、组稿、代发论文,收取审稿费、代写费、版面费,欺诈投稿人,严重损害了我刊名誉。据查其刊名及国内统一刊号、国际标准刊号纯属盗用;发给作者的用稿通知上所盖公章纯属伪造。

所谓的征稿行为已涉嫌侵权、诈骗、伪造企事业单位公章等多项犯罪,本刊已向公安机关报案。

本刊敦促相关网站及个人立即停止这一严重损害我刊名誉的侵权行为,本刊将依法保留追究有关人员法律责任的权利。特此声明!

获取在线投稿平台地址邮箱:chgc2008@vip.com,咨询电话:0451-88028906

(本刊编辑部)

Application of power polynomial based on Quantile Regression to data analysis

WANG Jiangrong1,YUAN Weihong2,ZHAO Rui1,REN Taiming1

(1. Dept. of Information Processing and Control Engineering,Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, China;2.Department of Civil Engineering, Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, China)

According to the nonlinear relationship between subgrade settlement and observation time, the accuracy of the traditional least squares parameter estimation is not high, so a power polynomial subgrade settlement prediction model with strong approximation ability is established, of which the model coefficients are estimated by quantile regression. Engineering example shows that the prediction based on the quantile regression estimates of power polynomial model has high accuracy, which is better than the least squares estimation of power polynomial prediction model and multi variable grey forecast model. This model can provide a new method for settlement prediction.

highway; subgrade settlement; power polynomial function; quantile regression; prediction of settlement

引用著录:王江荣,袁维红,赵睿,等.基于分位数回归的幂多项式在数据分析中的应用[J].测绘工程,2017,26(4):43-46,52.

10.19349/j.cnki.issn1006-7949.2017.04.008

2016-01-22

兰州市科学技术局计划项目(兰财建发[2015]85号);兰州石化职业技术学院科技资助项目(院发〔2015〕69号)

王江荣(1966-),男,教授,硕士.

TV196;U416

A

1006-7949(2017)04-0043-04

猜你喜欢
位数回归方程位点
镍基单晶高温合金多组元置换的第一性原理研究
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
五次完全幂的少位数三进制展开
连续自然数及其乘积的位数分析
走进回归分析,让回归方程不再是你高考的绊脚石
二项式通项公式在遗传学计算中的运用*
一种改进的多聚腺苷酸化位点提取方法