数据处理方法在数学建模竞赛中的应用

2022-12-05 11:36山西能源学院李璇
数字技术与应用 2022年11期
关键词:插值数据处理竞赛

山西能源学院 李璇

为了充分发挥出数学建模竞赛的作用,本文针对数据处理方法在其中的应用进行介绍。首先阐述数据处理方法和数学建模竞赛,分别从建模数据分析、数据插值与拟合、数据仿真处理、数据回归分析四个方面展开分析,了解不同分析处理方法在数学建模中的应用,明确数学建模竞赛中使用数据处理方法应该注意的关键点。以期能够通过数据处理方法简化数学问题。

数学建模是解决实际问题的一种方法,主要利用到数学语言,将实际问题简化、抽象、描绘处理之后,以解答问题为目标建构数学模型,其间可以利用信息技术作为辅助,求解得到的结果也需要进行解析、检测,将实际问题解决。数学建模过程中涉及非常多的实验参数,这些参数必须进行解析,通过计算机软件整合,此环节在数据建模中属于数据处理。应用一些比较特殊的处理方法,在实验参数中总结规律,所有参数融合分析。建模初期通过已知数据处理模式,分析面临实际问题模型所有变量之间的关系,其中部分模型建议利用回归分析法与时序分析法等统计解析法进行建构。数学建模竞赛中应用数学处理方法,因为该竞赛本身是以数学建模为基础,所以通过数学处理方法,可以真正体现出数学建模竞赛的优势,开发青少年思维,提高计算机软件操作、数学模型构建等的基础能力,灵活应用数学处理方法,从而使数据分析更具精准性。为此,本文针对数学建模竞赛中数据处理方法的应用做出分析,探讨数据处理方法的应用流程。

1 数据处理方法

以往应用的演算式数据处理法,在信息时代下无法满足数据处理的基本需求,而且数据处理方法也得到了创新,当下的数据处理方法是将计算机作为载体,再通过信息技术整理、分析数字信息[1]。目前比较常见的数据处理方法为表格和图示,比如:根据近年来数据趋势分析,数据整理之后可以绘制相应的折线统计图,可以直观分析数据走势;而要统计数据在整体中的百分比时,常用扇形图,可清晰显示数据比例。对比传统的图形绘制,利用软件技术构建数据模型,直接在软件中输入数据,软件可以直接绘制、生成图表,使数据处理更加准确以及高效。

2 数学建模竞赛及其意义

数学建模竞赛一般指中国大学生数学建模竞赛,秉持着“创新意识、团队精神、重在参与、公平竞争”的宗旨,在高等院校中是其培养创新型人才非常关键的教育形式。数学建模即针对数学问题,大学生利用数学思维与语言,判断问题中包含的数学关系,从而进行问题求解与解释[2]。数学建模竞赛面向大学生,培养大学生的创新意识与创造能力,大学生参与数学建模竞赛,可以锻炼其快速采集信息与资料、获取新知识的能力,加强大学生团队合作意识,有利于培养大学生的逻辑思维与开放性思维。

3 数学建模竞赛中数据处理方法使用策略

3.1 建模数据分析

一般数据建模过程中,采集或者提供原始数据,多是采用电子表格,而电子表格软件具有诸多功能,如参数排列、参数选择、分类总结以及函数换算。通过上述功能对建模的所有参数进行初级整合,比如重新排列关键词、按照数据与范围做出选择、分类分析、换算最大/最小值与频数。此外,电子表格还支持绘图,按照数学建模的不同要求,分别绘制散点图、曲线图或者直方图,预估判断参数的变化趋势。

3.2 数据插值与拟合

数学建模竞赛采用数据处理方法,数据插值与数据拟合比较常用。比如1998年举办的赛A 题涉及生物组织切片的问题,而此问题采用三维插值法进行求解。1994年组织的国赛A 题,对于山体海拔高度进行计算,依然可以采用数据插值法。除了上述两类问题外,2001年组织的国赛,包括血管三维重建的问题,此问题求解时构建最大内切圆模型,通过血管三维重建图像插入Matlab 程序代码,应用阴影插值函数进行求解。通过模型检验和误差分析,构建二值图像矩阵相加模型。误差分析时总结原因和优化方法,还可提出关于血管三维重建延拓猜想,明确前后图片相似度不高的成因,最终完成模型求解。由此可见,数据插值与数值拟合方法适用于多种建模。

面对拟合问题,利用实验数据明确已知函数参数,或者可以寻求近似函数,使获得的近似函数、已知数据之间拟合度较高。若明确数据存在误差,无需近似函数经过全部数据点,只需得出近似函数即可,而且要求近似函数能够反映数据变化规律,此为数据拟合[3]。按照已知数据点对应的实验数据,采取插值方法明确未知数据点数据,此方法为数据插值法。在数学建模竞赛中采用数值插值方法,如果实验条件存在一定的限制,或者是实验数据量较少,加上已经包含可信数据的情况下,一般可以采用函数插值方法,插值得到两个数据点间的所有数据点,绘制数据曲线途径所有实验数据点。利用插值函数分别属于不同的类型,逼近效果、光滑程度自然存在差异。数学建模中比较常用的数值插值方法包括Lagrange 插值、分段线性插值、Hermite 插值、三次样插值,上述插值方法均属于分段插值。应用Matlab 软件,该软件功能函数支持分段插值,无需编制函数程序。该软件支持Interpl(一维插值)、Interp2(二维)、Interp3(三维)以及Intern(n 维)等方法,一维插值与二维插值应用相对普遍[4]。例如一维插值,其函数格式yi=interp1(x,y,xi,method),(x,y)是插值节点,xi是被插值点,yi是xi位置的插值结果,如果设置默认条件,插值方法可以选择分段线性插值,最邻近插值是Nearest,线性插值是Linear,三次样条插值是Spline,立方插值是Cubic。在全部的插值方法当中,x务必具备单调性,xi在x取值范围以内。再如二维插值,其函数格式是yi=interp2(x0,y0,z0,x,y,method)。

在数学建模竞赛中采用数据拟合方法,对一些条件相对复杂的数学问题,利用实验数据可以直接建模,分析其中因果变量存在的数量关系,预测未知情形,所建模型即为拟合模型。利用拟合模型,有效控制实验数据误差,并通过数学表达式,立足于数量这一维度,总结近似表达因果变量存在的联系。构建拟合模型时,必须综合分析变量实验数据,科学选择拟合函数。常见的拟合模型有线性拟合、多项式拟合、曲线拟合这三种。如果使用Matlab 软件,可以直接利用函数polyval,polyval 的编程界面如图1所示。Spss 软件则是通过菜单、对话框,支持一次性选择多种模型,综合对比拟合度。一般在选择拟合模型时,需要提前绘制散点图,分析与总结数据分布,为最终确定模型提供依据。

图1 polyval 的编程界面Fig.1 The programming interface of polyval

3.3 数据仿真处理

数学建模必须采用计算机仿真技术,随机性模拟是其中比较常用的常规算法。一般构建数学模型时,数据仿真有数学仿真、计算机仿真这两种类型。数学仿真需要使用数学方程式,基于已知建立条件,采用数学表达式的方式完成模拟仿真。计算机系统中对相关体系数学模式展开实验,即为计算机仿真。计算机仿真模式的应用,可以改变仿真系统结构、数据,为数学模型解析提供便利。计算机仿真模式包含蒙特卡洛算法,也被称作随机性模拟方法,该算法比较常用。利用随机函数,针对待求解问题抽取随机样本,在获取样本之后对样本值进行观察和分析,通过统筹分析得到问题解答需要用到的参数。

比如全国大学生数学建模竞赛1997年A 题中,包含“零件参数预设”版块,该版块的算题之中,元件展示标定值、容差等级均不同,需要最终求解得到元件的最佳组合模式。或者通过计算过程相对复杂的数学表达式,在所有的108 类容差当中做出选择,挑选最佳预案。因为实际求解过程比较繁琐,并且面临较高的难度,所以只能采用计算机仿真模式进行求解。

粒子分离器的其中一个参数(y)与7 个零件参数(x1,x2,...x7)相关,由此得出经验公式:

y 目标值(y0)是1.50,如果y 已经偏离y0±0.1,此时可判定产品属于次品,并得出质量损失,是1000 元。如果y 已经偏离离y0±0.3,那么产品可判定为废品,得出损失是9000 元。因为零件参数标定值存在容许变化范围,将容差发呢为A、B、C 三级,表示为标定值的相对值。其中A 是±0.1%,B 是±0.5%,C 是±10%,所有的7个零件参数标定值容许范围和各容差等级对应零件成本如表1所示。采取批量成产的方法,每批为1000 个,原本的设计方案中零件参数标定值依次是0.1、0.3、0.1、0.1、1.5、16、0.75,而容差则确定为最便宜等级。根据y 偏离y0形成的损失与零件成本,并对零件参数进行重新设计,按照表1展开分析,各个元件可行区间按照正态分布,任意选择标定数据和容差数据,通过蒙特卡洛算法进行仿真分析,得到诸多预案,在所有预案中做出选择即可。

表1 零件参数标定值容许范围和各容差等级对应零件成本Tab.1 The allowable range of the calibration value of the part parameters and the cost of the parts corresponding to each tolerance level

3.4 数据回归分析

数学建模竞赛中采用回归解析这一数据处理方法,总体来说频率比较高,根据现有问题求解,发现在“长江水质的考察与预估”“HIV 病毒”和“高等学府学费”等问题中均可应用数据回归分析方法。所谓回归解析,可对应变量、多个自变量之间具有的线型和非线性关系进行分析,属于统筹解析模式。求解问题过程中解读应变量、自变量,便可明确变量之间存在的因果关系。构建回归模型,按照实际测算得到参数,预估模型所有数据,回归模型通过评价的方式判断其与实际数据之间的拟合度,根据自变量展开推导。

对比其他数据处理方法,回归解析模式具有比较扎实的理论基础,采样参数可以确定变量之间的定量关系,总结统筹变量数据发生的变化,从而构建变量之间定量关系数学模型,预测参数变化趋势。回归解析方法准确分析自变量在应变量影响趋势、影响程度等方面具有明显的优势,除了数学建模以外,也被广泛应用在了经济、金融、自然科学等专业领域,数据建模比赛当中的应用也非常普遍。回归解析常见的包括有Logistic 回归、线性回归、曲线回归、非线性回归等多种类型,可以采用电子表格、SPSS、Matalb、Eviews、Systart 等软件进行回归解析。

4 结语

综上所述,数学建模竞赛中应用数据处理方法,通过多元化数据处理方法,进行数据建模分析,不仅可以培养以大学生为代表的广大青少年群体创新意识与创造性思维,还可以提高数学建模分析能力,综合对比不同类型的数据处理方法,选择最为合理的处理方法进行建模分析,从而提高数学问题解题效率和精准性。

猜你喜欢
插值数据处理竞赛
2020丝绸之路数学竞赛
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
基于Sinc插值与相关谱的纵横波速度比扫描方法
我看竞赛
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
Blackman-Harris窗的插值FFT谐波分析与应用
基于POS AV610与PPP的车辆导航数据处理