一元线性回归分析方法在压力传感器数据拟合中的应用

2022-05-25 07:27李久龙李玲刘瑞敏孙旭薛炜许腾杨懿
计测技术 2022年2期
关键词:回程残差线性

李久龙,李玲,刘瑞敏,孙旭,薛炜,许腾,杨懿

(北京航天试验技术研究所,北京 100074)

0 引言

在工程实践中,传感器测量技术是获取测量数据的重要手段,其测量方式大致可分为线性测量和非线性测量两种[1]。对测量数据进行分析,多采用一元、多元线性回归分析等方法建立测量数据与物理量值之间的关系[2-4]。

压力传感器测量技术多采用线性测量的方式。线性测量具有操作简单、测量准确度高等特点,因而在工程中应用非常广泛。在进行参数测量前,需要将压力传感器送计量检定机构进行检定,以获取输入压力值与输出电压值之间对应的函数关系。

在计量检定中,通常根据压力传感器的量程设定多个压力参考点,通过标准活塞压力计输出对应压力点的标准压力值获取对应的电压/电流信号,再通过数学方法拟合压力值(MPa)与电压值/电流(mV/mA)之间的数学关系。在工程应用中,通常采用线性回归分析方法拟合因变量与自变量之间的函数关系。多位研究人员对线性回归方法在生产实践中的应用进行了深入研究。

郑锦秀[5]分析了电力系统测试中温度对大电流分流器测量的影响,采用一元线性回归方程拟合了大电流分流器阻值和温度的线性回归方程,通过显著性检验、相关系数等方法验证了回归方程的合理性。

许莉莉[6]针对一元线性回归方法中自变量在进行正交变换过程中会影响运算结果的缺陷,借鉴动力学中转动惯量的对称性质,提出了以转动惯量为基础的线性回归分析方法。通过仿真实验和回归实例证明了该方法比传统一元线性回归准确度更高、稳定性更好。但是该方法在应用过程中需要获取对称观测值,即获取平面上任意样本点相对于平面内直线y=kx+b的转动惯量,不适用于压力传感器输出数据的分析。

宫凯勋等人[7]针对传统压阻式压力传感器仿真设计中,压敏电阻应力值的垂直变化以及非线性影响设计精度的问题,提出了多元线性回归法对Z坐标下的X,Y坐标与应力值之间的关系式进行多次拟合,获取压敏电阻的整体平均应力值,有效提高了传感器的设计精度。

王惠文等人[8]针对传统线性回归方法中采用局部信息替代全部信息,无法充分有效利用原始数据信息的缺陷,将符号数据表的全部信息作为分析基础,建立了正态分布型数据矩阵模型和数字特征。通过仿真实验,验证了该方法的优越性。但是该方法在使用过程中仅仅针对正态分布型数据,在推广应用中具有一定的局限性。

刘军等人[9]采用最小二乘法对不同温度下超声波热量的时差和流量数据进行拟合。通过软件仿真得到不同温度下的时差、温度与流量的关系。通过对比分析试验,证明了最小二乘法拟合方法较传统的拟合方法具有拟合精度稳定、误差小的特点。

王海峰等人[10]分析了冲击波超压测量数据处理流程,采用自适应滤波的方法消除测量数据中的噪声,以阶跃波形为准则完成测量数据的有效性检验,根据不同距离传感器数据拟合多项式曲线,数据有效性验证证明了该数据处理方法实现了冲击波超压测量数据的自动化处理,提高了数据处理的效率和准确度。

赵彦凯等人[11]综合比较了普通最小二乘法和整体最小二乘法在电子测压器动态校准过程中数据拟合中的差异,建立了两种方法的回归模型,推导了整体最小二乘法的演算过程,从模型、参数估计和精度评定等方面对比分析了两种方法的优缺点,并指明了两种方法在电子测压器动态校准过程中数据拟合中的应用范围。

许浩源等人[12]采用微压力传感器测量声表面波的压力数据,利用最小二乘法建立数学模型,分析、拟合所测频率值与对应的载荷力之间的关系。通过构建BP 神经网络模型,训练已采集的数据样本,预测压力传感器的输入与输出之间的关系。遗传算法对BP 神经网络优化结果显示该方法能有效减少误差。

结合压力传感器测量技术的特点、输出数据的特征和工程应用的实际情况,本文分析了压力传感器检定数据的特征,采用一元线性回归分析方法拟合压力值(MPa)与电压值(mV)之间的数学关系,并对拟合的结果进行分析。该方法对计量检定人员研究检定数据拟合方法具有重要的参考价值。

1 压力传感器检定系统和检定数据结构

1.1 检定系统

本研究的数据来源于国防三级计量标准——0.02 级活塞压力计量检定装置。压力传感器检定系统由0.02级活塞压力计(含砝码)、精密直流稳压电源、数字多用表、计算机等设备组成[13]。

压力传感器检定系统组成如图1所示。

系统组成设备的功能:活塞压力计和专用砝码为被检压力传感器加载标准压力。精密直流稳压电源为被检压力传感器提供激励电压。数字多用表采集压力传感器输出的毫伏级电压信号,其输出端通过RS-232 串口与采集计算机实现通讯。计算机完成数据的采集、存储、分析和处理。

1.2 检定数据结构

选取1 支YB-1 型号的压力传感器,其量程为12 MPa,编号为H0608,最大综合基本误差为0.1%。依照相应检定规程[14]进行检定。检定过程分为三个进-回程。活塞压力计从0,2,4,6,8,10,12 MPa 七个点加载标准压力称之为进程,从12,10,8,6,4,2,0 MPa 的卸压过程称之为回程。整个检定过程分为进程1、回程1、进程2、回程2、进程3 和回程3,检定数据如表1所示。

表1 H0608压力传感器检定数据表Tab.1 H0608 pressure sensor verification data sheet

2 检定数据分析

2.1 传感器输出电压值与标准压力值的特征分析

根据表1 的检定数据,以进程1 的数据为例进行画图分析,压力值与电压值散点图如图2 所示。观察标准压力值与电压值之间对应关系可知,二者基本呈线性关系。

图2 进程1传感器压力值与输出电压值数据散点图Fig.2 Scatter diagram of pressure and output voltage data of sensor in process 1

2.2 正态性检验

假定压力传感器电压输出的观测值来自正态分布总体的简单随机样本,对所观测值进行正态性检验,绘制变量的正态概率图。以进程1的数据为例,运用Origin 软件对检定数据进行正态检验。检验结果如图3所示。

图3 进程1的正态性检验图Fig.3 Normality test chart of process 1

采用相同的方法对其他进-回程的数据进行正态检验分析可知,3个进-回程压力传感器电压输出值均服从正态分布。

2.3 方差分析

由于压力传感器的电压输出值仅与所加载标准压力值相关,故采用单因素方差分析法对数据的方差进行分析。单因素方差分析只考虑一个因素对观测数据的影响效应。

其基本原理[15]为:在水平Aj(j= 1,2,…,6)下,进行j次独立试验。假定各个水平Aj(j=1,2,…,6)下的样本来自具有相同方差σ2,均值分别为μj(j= 1,2,…,6)。μj和σ2未知,且在不同水平下样本之间相互独立。设每次采集的数据为Xij,Xij~N(μj,σ2), 即 有(Xij-μj)~N(0,σ2)。 将(Xij-μj)看作随机误差,记Xij-μj=εij,则可建立单因素试验方差分析的数学模型。

1)单因素试验方差分析的数学模型

单因素试验方差分析的数学模型条件:①Xij=μj+εij,i=1,2,…,n,j=1,2,…,s;②εij~N(0,σ2),各εij独立;

假设所检验的数据符合数学模型的条件①~③,则需要检验s个总体N(μ1,σ2),…,N(μs,σ2)的均值是否相等,即检验假设(α=设定值,α为观测 值 的 附 加 效 应 , 即 误 差 。) :H0:μ1=μ2= …=μs,H1:μ1,μ2,…,μs不全相等。

设μj的加权平均值1,2,…,s。其中,δj为水平Aj下的总体评价值与总平均的差异。此时有n1δ1+n2δ2+ …+nsδs= 0。

在实际运用中可按照表2中的方差来源进行方差分析。

表2 单因素试验方差法分析表Tab.2 Variance analysis table of one-way test

SA(Aj水平下样本均值与数据总平均的差异),SE(误差的平方和),ST(总偏差的平方和)的具体计算定义如式(1)~式(4)所示。

式中:SA为Aj水平下样本均值与数据总平均的差异;SE为误差的平方和;ST为总偏差的平方和;Xij为每次采集的数据;j为试验次数;s为检验总体个数;为Aj水平下的样本均值,。

2)效应检验

在实际的检定过程中,每一个进-回程分别对应0~12 MPa 量程内7 个采样点,总计形成6×7=42个数据。受篇幅所限,选取2 MPa压力点的数据作为效应检验对象。在标准活塞压力计加载2 MPa压力时,对应每一个进-回程采样点,在较短时间内连续快速采集3次数据,详细数据如表3所示。

表3 2 MPa压力点压力传感器连续采集3次数据表Tab.3 Data sheet of 3 times consecutive acquisition by pressure sensor at 2 MPa

假设加载压力值对电压输出的影响效应分别为μ1(进程1),μ2(回程1),μ3(进程2),μ4(回程2),μ5(进程3),μ6(回程3)。数据符合数学模型的条件,检验假设(α= 0.05)[16]:

H0:μ1=μ2=μ3=μ4=μ5=μ6(进-回程对电压输出值没有显著影响);

H1:μ1,μ2,μ3,μ4,μ5,μ6不全相等(进-回程对电压输出值有显著影响)。

根据式(1)~式(5)对表4中数据进行计算,设Xij为 每 次 采 集 的 电 压 值。s=6,j=3,n=s×j=18。计算结果见表4。

表4 2 MPa压力点电压输出数据方差计算表Tab.4 Variance calculation of output voltage data at 2 MPa

根据式(2) ~式(4) 可得ST=0.00043584;SA=0.00043545;SE=ST-SA=0.00000039。ST,SA,SE的自由度依次为17,5,12,方差分析见表5。

表5 2 MPa压力传感器输出电压方差分析表Tab.5 Variance analysis of output voltage of pressure sensor at 2 MPa

F0.05(5,12) =3.11<2702.8,故 在水 平0.05 下拒绝H0,认为在加载2 MPa 标准压力下,在不同进-回程中,压力传感器的输出电压有显著的差异。

3 一元线性回归分析

一元线性回归分析主要用于研究单个因变量和自变量之间的线性关系,其重点是考察一个特定因变量,将自变量看作影响这一变量的因素,通过建立适当的数学模型将变量之间的关系合理、准确地表达出来,进而通过自变量的取值来预测因变量的取值。因此,在实际应用中,需要针对选定的数据,分析因变量与自变量之间的关系,通过建立回归模型,并分析该模型的误差,以实现对自变量与因变量之间关系的准确描述。

由图2的分析可知,观测点基本分布在一条直线周围,压力值增加,其电压输出值随之增加,电压值与压力值呈线性相关关系,因此可以对其进行一元线性回归分析。

3.1 相关系数计算

选取表1 中回程1 的数据计算相关系数r。计算结果为

相关系数r=1表明加载压力值与输出电压值之间是完全正线性相关关系。

3.2 一元线性回归模型

设压力值y关于电压值x的回归函数为μ(x),利用样本来估计μ(x)。假设对于电压值x(在某个区间内)的每一个值都有

式中:a,b,σ2为不依赖于x的未知参数。记ε=y-(a+bx),对压力值y作正态假设,其一元回归模型为y=a+bx+ε,ε~N(0,σ2)。

根据正规方程组[17]

有唯一解,求解得到a,b的最大似然估计值a͡,分别为

对于给定的x,取a͡+b͡x作为回归函数μ(x) =a+bx的估计,即μ(x) =a͡+b͡x。a͡,b͡由式(10)~式(14)计算。

蓦然,程晓觉得,自己拥有这辆凯迪拉克后,没有真正成为身份的象征,日子过得如此辛酸,并不是买凯迪拉克买得不切实际,而是用错了地方!无论在公司里当技术员,还是当管理者,凯迪拉克都只是一件奢侈的消费品;但换一个地方,比如这个小老板谈业务时,别人不知他的出身背景,凯迪拉克就恰到好处地为他脸上贴了一层金,让人不敢小窥他,而与他合作。这时的凯迪拉克,就成了他与人叫板的砝码,买凯迪拉克就变成了一种投资,投资能获取效益,与消费是两个概念。由此,程晓对凯迪拉克的认识发生了质变,他的生活发生了质的飞越!

以进程1 的7 个采样点数据为例进行分析计算,详细数据见表6。

表6 压力传感器进程1检定数据表Tab.6 Verification data of pressure sensor in process 1

根据式(10)~式(14)计算,结果为

故得到

得到回归直线方程为

按照同样的方法分别计算回程1、进程2、回程2,进程3和回程3的回归直线方程,截距a和斜率b的估计值的计算结果如表7所示。

表7 压力传感器检定数据拟合回归系数表Tab.7 Fitting regression coefficient of pressure sensor verification data

3.3 一元线性回归模型的拟合优度计算

总变差(SST)可分解为回归平方和(SSR)和与残差平方和(SSE)的加总。即

回归平方和(SSR)与总变差(SST)的比例称为决定系数,计算公式为

以回程2的数据为例,进行一元线性回归模型的拟合优度计算,数据计算结果为

估计标准误差是残差的平方和的均方根,用se表示,计算公式为

从估计标准误差se=0.001752 可知,观测值与回归估计值之间的差异程度非常小。从一元线性回归方程的拟合优度值R2= 0.999999 可知,回归直线与各观测点几乎重合,该回归直线是拟合数据较为理想的拟合直线。

3.4 一元线性回归模型线性关系检验

在建立回归模型之前,假定压力传感器所测压力值和输出电压值之间是线性关系,但是该假定是否成立需要进行检验。上一节拟合了一元线性回归方程,求出了系数。为了检验x,y之间关系的显著性,采取数理统计方法进行验证。将回归平方(SSR)除以与残差平方和(SSE)的结果称为回归均方,记为MSR,SSE除以相应自由度的结果称为残差均方,记为MSE[15]。提出假设

H0:b= 0(x,y之间的线性关系不显著)

H1:b≠0(x,y之间的线性关系显著)

若假设H0:b= 0(x,y之间的线性关系不显著)成立,的值应接近1。若原假设不成立,则的值趋近无穷大。

以回程2 的数据为例,计算结果为SSR=111.999985,SSE=0.001752,319559.556751,远大于1。因此,假设H0不成立,拒绝H0,即x,y之间的线性关系显著。

3.5 一元线性回归模型回归系数检验

回归系数检验的目的是检验自变量对因变量的影响是否显著。统计学中通常采用t检验法检验自变量对因变量的影响的显著性[13]。在一元线性回归中,由于自变量只有一个,故回归系数的检验等价于线性关系的检验。检验假设为

H0:b= 0(自变量x对因变量y的影响不显著)

H1:b≠0(自变量x对因变量y的影响显著)

引入标准差估计量sb͡

当H0为真,即b= 0时设α为显著水平,得到H0的拒绝域|t|为

以回程2的数据为例,计算结果为

查表得

同理,可以运用相同方法对其他数据进行显著性检验分析。

3.6 一元线性回归模型的残差分析

在一元回归模型y=a+bx+ε中,假定ε是期望值为0,方差相等且服从正态分布的一个独立随机变量[15]。但若此假定不成立,则所做检验以及预测则均不准确。因此,需要对ε进行残差分析。因变量的观测值yi与根据估计的回归方程求出的预测值之差即为残差。第i个观测值的残差数学定义为

3.6.1 残差图检验

可通过残差图来分析检验误差项ε的假设是否成立。通过一元线性回归公式(17)计算表1 中7个进、回程传感器输出电压值的残差,数据的残差图如图4所示。

图4 检定数据残差图Fig.4 Residual diagram of verification data

根据图4可知,各残差基本位于一条水平带中间,基本无固定模式,表明在压力传感器压力值与电压输出值的一元线性回归中,线性的假定以及对ε的假定是成立的。

3.6.2 正态性检验

通过标准化残差分析对ε正态假定进行检验。标准化残差用ze表示,第i个观测值的标准化残差定义[13]为

若关于ε正态假定成立,则标准化残差的分布也服从正态分布,且大约有95%的标准化残差落在-2~+2区间。

计算表1中各数据点的标准化残差,计算数据如表8所示。

表8 压力传感器检定数据标准化残差表Tab.8 Standardized residual of pressure sensor verifi⁃cation data

从表8中标准化残差的计算结果可知,标准化残差均分布在-2~+2 区间内,表明关于ε服从正态分布的假定成立。

通过本章节的分析可知,一元线性回归分析的主要步骤:

1)确定变量之间的关系

可采用散点图,计算、检验相关系数的方法确定自变量与因变量之间的关系。

2)建立一元线性回归模型

一般采用最小二乘法确定回归方程及其系数。

3)一元线性回归模型的拟合优度计算

一般选用决定系数作为拟合优度的重要统计量。

4)一元线性回归模型线性关系和系数检验

采用数理统计F检验和t检验方法验证线性关系和系数的显著性。

5)一元线性回归模型的残差分析

采用残差图检验和正态性检验的方法验证残差ε正态假定是否成立。

4 总结

从压力传感器的实际应用出发,分析了压力传感器计量检定数据的特征,采用一元线性回归分析方法拟合压力传感器检定数据,建立输出值(mV)和加载标准压力值(MPa)之间的数学函数关系。通过正态检验、方差分析、回归模型拟合优度分析、模型线性关系分析、回归系数和模型残差分析等方法验证了一元线性回归分析方法能够应用于压力传感器检定数据的拟合工作中。对业内计量检定人员拟合检定数据具有重要的参考价值。

猜你喜欢
回程残差线性
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
二阶整线性递归数列的性质及应用
摆动斜楔及其回程机构
基于ADAMS和Pumplinx联合仿真的柱塞泵回程盘运动受力薄弱点分析
线性回归方程的求解与应用
基于残差学习的自适应无人机目标跟踪算法
基于深度卷积的残差三生网络研究与应用
春日别君