基于Matlab和Excel的误差理论教学软件设计

2021-04-20 12:06李芳卢鑫垚陈龙陈玮
电脑知识与技术 2021年7期
关键词:数据处理

李芳 卢鑫垚 陈龙 陈玮

摘要:针对误差理论与数据处理教学过程中存在的数据计算量大,学生理解困难等问题,提出应用Matlab和Excel软件相结合,实现人机交互,测量数据的自动读取及分析功能。应用到教学中,可以帮助学生理解数据处理的理论知识,直观观测到数据的变化趋势及实现数据的分析预测,有效提高教学质量。

关键词:数据处理;等精度数据处理;回归分析及预测

中图分类号: G424        文献标识码:A

文章编号:1009-3044(2021)07-0066-02

误差理论与数据处理课程是测控技术与仪器专业的一门重要的专业基础课,属于交叉学科。该课程以概率论、数理统计、矩阵论、随机过程等为基础,内容主要包括含误差的测量数据处理方法、误差的合成与分配、曲线拟合等多方面的知识,要求学生能解释相关的专业术语、能实现对测量误差的来源和测量误差分布类型的判断、能实现对随机误差、粗大误差、系统误差的处理并能实现各种误差的合成和分配及测量数据的一元线性回归分析。本课程中涉及了大量的数学计算,这就对学生的数学知识的掌握程度提出了更高的要求。教學中教师往往花费大量的时间来讲解数学过程,而学生对枯燥的数学公式推导望而却步,学习兴趣往往不高,考试前突击地机械性记忆公式,而不能理解其实际的物理意义,无法与工程应用相结合,理论难以在实际测量中得到很好的应用[1-3]。

本课题根据误差理论课程知识模块的特点,将Matlab软件与Excel软件相结合,通过人机界面调用测量数据,Matlab软件实现误差信号的各种分析处理,简化大量的数学计算,加强学生对数据处理方法的理解,能直观地看到检测点的曲线图和数据处理结果[4]。同时通过测量数据进行误差来源的分析,巩固学生对于误差合成和分配的概念。在曲线拟合中,通过测量数据的读取,选择不同的曲线拟合形式,得到不同的结果,也可实现对测量结果的预测。实现课程以学生为中心、教师为指导,注重教学内容与算法实现的融合,突出学生的主动参与、思考和实践。通过理论知识传授、工程软件仿真及教学演示测试等环节,形成的探究式教学方式,有助于学生更直观与深入地掌握误差分析理论和数据处理方法。

1 系统结构

根据课程内容要求,设计软件主要包括等精度数据处理和回归分析两部分:

打开Matlab主界面,输入guide,完成主界面的设计。然后完成数据读取、存贮功能的实现:

测量数据保存方式可以是.xls或.txt等格式,在程序运行中,首先需要运行主界面,打开数据文件,读取数据。

数据读取可通过两种方式实现:

方式一:直接读取数据文件

点击导入数据文件按钮,选择callback选项,填入以下程序段。

[FileName PathName]=uigetfile({'*.xls','ExcelFiles(*.xls)';'*.txt','Txt Files(*.txt)';'*.*','All Files(*.*)'},'Choose a File');

str=[PathName FileName];

num=xlsread(str,'A1:B3');

set(handles.uitable1,'data',num);即可将数据在界面上显示出来

方式二:在界面上添加控件,可以从界面上直接输入测量数据。

数据存贮程序如下:xlswrite('test.xlsx',num);

数据处理结果将保存到Matlab工作文件夹下。

2 等精度数据处理功能实现

误差的变化规律各不相同,由此可以分为随机误差、系统误差和粗大误差三类。由于系统误差的减小和消除通常不通过数据处理实现,所以本文中的数据处理主要针对随机误差和粗大误差进行。其数据处理流程图1所示。

1)最佳测量值的表示:

以等权测量条件下,对同一量进行多次重复测量,得到一系列不同的测量值。根据随机误差的处理方法,最可信赖值可用以下公式表示:

由于随机误差的本质特征是抵偿性,所以将算术平均值作为测量结果的最佳估计。通过此种方法计算的值,可以有效减小随机误差的影响。

2)粗大误差判断:

在对一列重复测量数据进行处理的过程中,可能会出现有某个数据与其他数据相比差异较大,此时其值就可能含有粗大误差的影响。根据随机误差理论,出现大误差的概率虽然小,但也是可能的,不恰当地剔除含大误差的正常数据,会造成测量重复性偏好的假象。反之对确定混有粗大误差的数据未加剔除,必然会造成测量重复性偏低的后果。

粗大误差的判断准则应用最广泛的是拉伊达准则,是以测量次数充分大为前期的。格拉布斯准则和狄克逊准则也被经常使用,本教学软件中将根据不同的测量条件实现这三种准则的合理选择及运用。

本软件在选择粗大误差判断准则时,当测量次数n>50时,可以采用拉伊达准则,50>n>30采用格拉布斯准则。30>n>3时,格拉布斯准则和狄克逊准则要同时应用。若其结果出现差异,则可以认为该数据没有粗大误差,此数据不应该被剔除。在本设计中,根据测量次数的多少,并根据具体的使用条件自动合理选择应用的准则,并在界面中加以显示。

在实际测量中,如果无法判断数据分布是否服从正态分布或测量数据偏离正态分布严重的情形下,可以采用测量数据的稳健处理方法,其流程如图2所示。

3)随机误差的处理:

在置信概率p一定的情况下,置信区间的大小与误差属于哪种分布形式是密切相关的,本软件中按照正态分布来表示置信区间,也就是极限误差。数据处理结果如图3所示。在不同概率情况下,可以得到不同大小的极限误差。

在界面中,左侧实现数据输入功能,中间列是数据处理流程,右侧将数据以图像形式显示出来,图中的上下限是应用拉伊達准则计算出来的极限误差值的图线。

数据处理的结果在页面最下行显示出来,如图3所示。

3 曲线拟合功能实现

回归分析是处理变量之间相关关系的一种数理统计方法,也是广泛用于获得数学表达式的较好方法。

本软件中主要对一元线性回归进行分析处理。

假设有自变量x1,x2,…,xn,此时获得的输出量为y1,y2,…,yn,则通过对测量值y1,y2[,…,]yn之间的差异进行分析可知,差异来源于两个方面:

首先自变量x取值的不同造成输出值y也不同;其次是由于测量误差的存在等其他因素的影响导致输出值产生差异。所以如果将上述两个因素造成的结果分离出来,就可以实现对对线性回归的效果进行检验。

将变量y的n的测值与其平均值的偏差分解为由变量x变量的不同取值引起的回归偏差和由测量误差等其他因素造成的残余误差,并进一步用n个值的偏离平方和来描述。也就是总偏差平方和反映因变量的n个观测值与其均值的总偏差;回归平方和在总的偏差中因x和y的线性关系而引起y变化的大小;残余平方和在总的偏离中除了x对y线性影响之外的其他因素而引起y变化的大小。回归分析的要求就是使残余平方和最小,其值越小,说明回归效果越好。

从实际测量中可以发现,任意一组测量数据(xi,yi)都可以采用此方法拟合出回归方程,但是如果实际的测量点数据实际是分散的,不呈线性,那讨论回归就没有意义了。所以要对数据是否真的能够显著呈现线性进行检验。一元线性回归自变量x和输出量y之间的线性关系的检验实现就是将回归平方和(代表线性回归程度)和残余平方和(代表测量误差等因素的影响)的值作比值。本软件中应用F检验(也可以使用其他检验方法),在一定置信概率p下,如果回归平方和远大于残余平方和,说明回归效果非常显著,x和y的线性关系明显,反之则不显著,就无法说明二者呈现线性关系。

在软件界面中(如图4所示),左侧实现的是数据输入功能。右上侧是根据输入数据所进行的方差分析表格,假设服从F分布(也可以选择其他类型),可以通过查表求出不同[α(显著度)]情况下的临界值,由此判断是否高度显著,得出有效结论。

右下角是利用分析结果做出的回归直线及预测区间,选择不同概率情况下,可以得出不同的数据预测区间。

4 结论

适用于误差理论与数据处理课程项目式教学的软件还有很多,本课题选择Matlab和Excel实现了人机的交互,数据的自动输入和手动输入、等精度数据处理及回归分析等功能,简化了数据处理的计算过程,学生可以使用该软件进行数据处理,使学生直观形象地理解误差理论的知识。在后续的功能扩展中,将继续将其与虚拟仿真软件相结合,实现测量过程的仿真与数据实时读取,加速推进误差理论与数据处理课程的教学改革之路。

参考文献:

[1] 李成,钱政,樊尚春,等.《误差分析与数据处理》的探究式教学[J].实验科学与技术,2013,11(1) 83-85,148.

[2] 费业泰,蒋敏兰,刘芳芳.动态测量精度理论研究进展与未来[J].中国机械工程,2007(18):2260-2262.

[3] 汪凤林,汪秀丽,温秀兰.误差理论与数据处理课程改革探索[J].中国现代教育装备,2008(11):60-62.

[4] 费业泰.误差理论与数据处理[M].北京:机械工业出版社, 1986.

【通联编辑:唐一东】

猜你喜欢
数据处理
验证动量守恒定律实验数据处理初探
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于低频功率数据处理的负荷分解方法
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
ADS-B数据处理中心的设计与实现
MATLAB在化学工程与工艺实验数据处理中的应用
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
大数据处理中基于热感知的能源冷却技术
Matlab在密立根油滴实验数据处理中的应用
我国首个“突发事件基础数据处理标准”发布