基于L1范数的出国留学人数组合预测研究

2022-05-18 01:42
关键词:精度神经网络误差

胡 珍

(湖北工业大学 理学院, 武汉 430068)

0 引 言

留学是我国发展对外开放教育和现代化经济以及实施人才强国战略的重要途径之一,同时也是我国高等教育规模扩张的一个重要过程。2020年《意见》的印发,强调出国留学仍是为我国提供现代化建设所需的各级各类人才的重要途径之一,疫情只是暂时性地阻碍了出国留学的发展,要把握疫情防控下的教育改革发展,坚持对外开放教育理念不动摇,同时积极增加同世界各国教育的密切联系[1]。科学有效地预测出国留学人数,有助于全面把握出国留学工作的总体大局,并对促进我国未来留学工作发展规划的制定和实施具有重要意义。

近年来已有学者对出国留学的相关问题进行了深入研究。如潘昆峰等[2]发现影响大学生出国留学的因素包括宏观与微观两个方面;陈玥等[3]通过研究出国留学政策的历史变迁得出政府决策、市场需求、科技发展这三方面对出国留学影响较大;魏永长等[4]通过问卷调查和访谈研究,得出个人主观愿望、家庭状况、外部因素对学生出国留学意愿均有影响;陆根书等[5]通过提出综合选择模型,分析了影响大学生出国留学的因素。陈扬霖等[6]对高校学生出国的趋势和影响因素等进行了探究,结果发现出国留学人数逐年增加,且家庭背景、人力特征等因素对出国留学均有影响;柯普等[7]应用GM(1,1)模型对出国留学人数进行了预测,结果表明2011—2015年间我国留学人数呈快速增长的态势;杨彩华[8]采用了时间序列预测法中的趋势外推法预测了我国留学人数;冯志平等[9]利用ARIMA模型预测了留学人数以及granger因果检验分析了留学人数和居民消费之间的关系,结果发现,随着经济快速发展和居民收入的增加,自费出国留学人数激增。

综合已有研究发现,出国留学相关研究仍存在两个方面的问题:其一,大部分研究都是基于定性的方法探究出国留学影响因素;其二,利用统计模型对出国留学人数进行预测的研究相对有限,且模型和预测的方法比较单一,没有进行模型对比和形成公认的最优预测方法或统计模型。其中柯普利用的GM(1,1)模型对预测留学人数有一定的参考价值,但通过分析留学现状以及成因可以发现,随着近年来出国留学人数日趋增加,影响留学的因素也在不断变化,呈现多元化趋势,故对模型的预测精度提出了更高的要求,则前人所用的以单一因素建模的GM(1,1)模型可能难以全面反映现代数据的复杂状况,拟合精度也会随之降低,并且选用单一模型预测,可能就要承担一定的决策失误风险。

针对现有研究存在的问题,有必要寻求新的预测方法或模型,对预测留学人数加以研究。因此,提出一种基于L1范数的组合预测模型。国外学者Bates和Granger,在1969年首次研究了组合预测模型[10],国内一些学者对其也进行了深入探究[11-13],且取得了良好的研究成果。组合模型一般能利用各种预测方法所包含的信息进而更加有效地提高预测精度,而组合预测方法的关键在于如何有效地选择加权系数,在实际生活中,通常单一模型在不同时刻的预测精度并不相同,故传统的不变权组合模型可能会降低预测精度,而基于L1范数的变权组合模型可以提高传统的组合模型的预测精度。因此,基于L1范数对单项预测模型赋权,并建立以最小对数误差为准则的组合预测模型,再通过线性规划求解模型;然后,通过对比不同模型的预测效果,表明基于L1范数组合预测模型的有效性[14];最后运用组合预测模型对我国未来几年的出国留学人数进行预测,为分析疫情背景下出国留学人数的总体趋势和相关部门制定决策提供参考依据。

1 预测模型理论与建模框架

1.1 灰色预测模型

1.1.1 灰色系统

灰色系统理论是由邓聚龙教授[15]提出的,它着重研究了生活、经济、科研活动中等难以解决的“小数据”和“贫信息”以及“不确定性”等问题。“灰”即指信息的不完全。考虑影响留学因素过多且复杂以及信息不完全性等问题,故采用灰色系统进行建模。

1.1.2 灰色关联度

设系统行为序列为

Xi=(x1(1),x1(2),…,x1(n)),i=1,2,3,…,m

对于ξ∈(0,1),令

γ(x0(k),xi(k))=

(1)

(2)

则γ(X0,Xi)称为X0与Xi的灰色关联度[15]。

1.1.3 GM(1,N)模型

(1) 设有原始序列为

X1(0)=(x1(0)(1),x1(0)(2),…,x1(0)(n))

关联序列为

Xi(0)=(xi(0)(1),xi(0)(2),…,xi(0)(n)),i=2,3,…,N

(2) 时间响应函数计算公式[12]为

(3)

1.2 BP神经网络模型

针对一些无法用线性模型解决的问题,神经网络利用自身较强的映射能力,可以较好地解决这类非线性问题。BP神经网络是一种误差反向传播和信号正向传播的多层前馈神经网络,一般包括输入、隐含、输出三层或者以上的神经网络,而且能够较好地逼近非线性连续函数[16]。考虑出国留学影响因素众多以及因素与人数之间复杂的非线性关系,使得难以精准预测留学人数,而神经网络模型恰好使得输入与输出之间,呈现出高度非线性的映射特点,更好地进行非线性预测。

BP神经网络构建主要分成3步,首先,生成BP网络,再进行网络训练,最后得到网络仿真,其函数表达式如下。

若一个神经元模型有n个输入变量,w为连接不同神经元之间的权重,最终输出为

y=f(wx+b)

其中,b为神经元的偏置值,f为传递函数。

BP神经网络拓扑图如图1所示,图1中输入层、隐含层以及输出层神经元节点个数分别为n、m、l,这种结构称为n-m-l三层BP神经网络[16]。其中,xi(i=1,2,…,n)为实际的输入值,yj(j=1,2,…,m)是隐含层的输出,Ok(k=1,2,…,l)为实际输出,隐含层和输出层阈值分别为a,b,输入层与隐含层以及隐含层与输出层之间的连接权值分别为vij,wjk。

此处,权值更新的计算公式[16]为

图1 BP神经网络拓扑图

1.3 基于L1范数的加权几何平均的组合预测模型

采用陈华友等[17]提出的基于L1范数的加权几何平均的组合预测模型,利用预测误差绝对值的和,衡量预测精度,这样可以克服预测误差再平方以后导致误差扩大或者缩小的缺陷,尤其针对数据中存在异常值的问题,其模型参数估计的稳健性比预测误差平方和要好。

定义1[11]:令

eit称为第i种单一预测模型第t时刻预测值与实际值之间的对数误差,et为第t时刻的组合模型预测值和实际值之间对数误差。

定义2[17]:令

(4)

称F为加权几何平均组合模型预测值与实际值之间的基于L1范数对数误差,其中,Fi为第i种单一模型预测值与实际值之间的基于L1范数对数误差。

定义3[17]:设F(L)为各种预测模型的加权系数向量的函数,则基于L1范数以最小对数误差为准则的加权几何平均组合预测模型为

(5)

若要求目标函数的最小值,可做如下变换,将其转化为线性规划问题,令

则|εt|=εt++εt-,εt=εt+-εt-,εt+εt-=0

在上述变换下,式(5)可改写成如式(6)模型:

(6)

此处可以利用MATLAB或LINGO软件求解,求得的最优解L即为组合预测模型的加权系数。

1.4 建模框架

首先选取柯普文章中提到的GM(1,1)作为对照模型,但仅以单一因素建模,难以精准预测留学人数,而GM(1,N)模型主要用来研究多外部因子影响内部因子的动态变化关系,克服了以单一因素建模的局限性;针对出国留学与各影响因素之间属于非线性函数的问题,若使用传统的线性回归预测方法可能难以反映它们之间的非线性关系,而BP神经网络模型可以适应非线性预测,使得输入与输出之间呈现高度的非线性映射特点,因此建立BP神经网络模型;然后构建基于L1范数改进的组合预测模型;最后,利用预测误差评价指标体系比较GM(1,1)、GM(1,3)、BP神经网络模型和基于L1范数改进的组合模型预测精度,具体建模框架如图2所示。

图2 建模框架图

2 实证分析

2.1 数据说明

数据均来源于《中国统计年鉴》和中华人民共和国教育部官方网站。由于中华人民共和国教育部官方网站中2020年我国出国留学人数还未更新,并且考虑各变量数据的时效性和可获得性,仅选取2006—2019年出国留学人数以及各变量统计数据进行分析。

2.2 对照模型预测

对照模型GM(1,1)的未知参数求解计算如下:

根据式(7)

(7)

将k代入响应方程,可计算GM(1,1)模型的预测值及预测精度。

2.3 GM(1,3)模型预测

2.3.1 数据样本指标的选取

由于数据样本的选取对模型的构建及其预测结果影响较大,而影响留学的因素众多,其中又有一些因素是难以量化的,倘若选取全部的因素构造预测模型是难以实现的。因此,要科学地选取外部影响因素,并尽可能客观真实地反映留学人数的变化规律,这样预测留学人数变化趋势才更准确且具有说服力。刘志民等[18]认为一国经济发展状况和教育投入是影响留学的重要因素。刘玉君等[19]通过实证分析发现,教育经费的投入对经济发展有促进作用,同时也是实现经济可持续发展的现实要求。刘倩等[20]认为经济发展水平和产业结构对中国高等教育有一定的影响。马子健等[21]选取普通高等学校毕业生数、城镇居民家庭人均可支配收入作为影响大学生出国留学影响因素。根据科学性、可行性等原则,借鉴前人文献指标的研究成果,选取国民总收入、教育经费投入、普通本专科毕业人数、城镇居民人均可支配收入作为影响出国留学的外部因素,具体数值如表1所示。

表1 出国留学人数影响因子

2.3.2 灰色关联度计算与典型因子的选取

通过式(1)、式(2)计算可确定N,由表2可知教育经费投入与出国留学人数之间的灰色关联度最大(r=0.837 8),其次是国民总收入(r=0.995 9)、城镇居民人均可支配收入(r=0.677 9)、普通本专科毕业人数(r=0.731 7),从中选取灰色关联度r>0.7的3个典型因子,即教育经费投入、国民总收入、城镇居民人均可支配收入,则N=3。

表2 灰色关联度系数表

2.3.3 数值计算

2.4 BP神经网络模型预测

选取国民总收入、教育经费投入、城镇居民人均可支配收入、普通本专科毕业人数作为BP神经网络的输入层,出国留学人数为输出层,则输入层神经元个数为4,而输出层神经元个数是根据具体问题确定的,本文是针对预测出国留学人数的问题,故输出层神经元数目为1,隐含层结点数为6。函数选取和参数设定分别为:训练函数用弹性梯度下降法trainrp,最大训练次数=50 000,精度=0.004 5,学习率η=0.01,迭代次数=50,具体算法流程如图3所示。用MATLAB运行后可得网络实际输出值与期望输出值,结果及预测精度如表3所示。

图3 BP神经网络算法流程

表3 单项预测模型预测结果及其预测精度

2.5 基于L1范数的组合预测模型预测

根据表3可知,GM(1,3)模型、BP神经网络模型的拟合精度均高于GM(1,1)模型,再选用GM(1,3)模型和BP神经网络模型进行组合,将这两个单一模型在各个时期的预测值代入基于L1范数改进的组合预测模型式(5),可得到基于L1范数改进的最优化组合预测模型:

minF(l1,l2)=|0.044 5l1-0.123 3l2|+|0.039 1l1-0.020 3l2|+|0.038 7l1-0.092 8l2|+|-0.014 1l1+0.074 1l2|+|-0.039 2l1+0.048 3l2|+|-0.080 6l1-0.014 0l2|+|-0.071 9l1-0.035 3l2|+|-0.029 5l1-0.024 4l2|+|-0.006 7l1-0.029 7l2|+|0.019 8l1-0.025 6l2|+|-0.054 7l1-0.115 3l2|

利用LINGO软件对上述式子求解,得到最优化模型的解为

l1*=0.5171,l2*=0.482 9

再将模型的最优解代入式(4),计算得基于L1范数的组合预测模型的预测值和预测精度如表4所示。

表4 基于L1范数的组合预测模型预测值与预测精度

2.6 各单项预测与组合预测结果对比

为体现基于L1范数的组合预测模型的有效性,将3个单一模型和基于L1范数的组合模型的预测值与实际值进行对比分析,如图4所示。

(a) GM(1,1)与GM(1,3)模型对比

从图4可以直观地看出:GM(1,1)模型与实际值的预测效果不佳,GM(1,3)模型、BP神经网络模型对实际值的预测效果较好,基于L1范数的组合模型预测效果最佳。为了进一步比较基于L1范数的组合预测模型与3个单一预测模型之间的优劣,利用预测误差平方和、平均绝对误差、平均绝对百分比误差、均方误差、均方百分比误差5个评价指标构成的模型预测效果评价指标体系进行比较,结果如表5所示。

(1) 预测误差平方和:

(2) 平均绝对误差:

(3) 平均绝对百分比误差

(4) 均方误差

(5) 均方百分比误差

表5 模型预测效果评价指标体系

从表5可以看出,3个单一模型的各项指标误差均高于基于L1范数的组合预测模型的误差指标值。即基于L1范数改进的组合预测模型的预测效果更优,并且有效地利用了单一模型提供的信息,从而提高了预测精度,可以更加准确地预测我国出国留学人数,同时利用组合模型预测我国未来几年出国留学人数,结果如表6所示。

表6 2020—2021年出国留学人数预测

3 结束语

出国留学教育作为促进我国经济和高等教育发展的重要方式之一,且留学生规模又作为衡量留学教育的一个重要指标,故有必要选择一个相对最优模型来精准地预测出国留学人数。在借鉴前人研究的基础上,选取GM(1,1)模型为对照模型,同时构建了GM(1,3)模型、BP神经网络模型和基于L1范数的组合预测模型,结果显示基于多因素建模的GM(1,3)模型的预测精度相对于以单一因素建模的GM(1,1)模型显著提升;同时,BP神经网络模型的精度相对于GM(1,1)模型又一次提高,而基于L1范数的GM(1,3)和BP神经网络的组合模型预测精度又高于3个单一模型预测精度,故所建立基于L1范数的组合预测模型相对于单一模型在预测出国留学人数更有优势。通过实证分析可知,未来留学人数将会有增长趋势,但由于一些重大突发事件,如非典、金融危机、新冠病毒等非常规因素,会对预测结果产生影响。故需要结合非常规因素,对当前疫情下留学的发展趋势做进一步讨论。

猜你喜欢
精度神经网络误差
基于不同快速星历的GAMIT解算精度分析
数字化无模铸造五轴精密成形机精度检验项目分析与研究
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
CBCT图像引导的放疗前后半程摆位误差分析
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用
近似边界精度信息熵的属性约简
三次样条和二次删除相辅助的WASD神经网络与日本人口预测