ARIMA模型探索时间序列模型在医院急诊人数预测研究中的应用

2020-11-23 12:02张卯红南京市浦口区中心医院
数码世界 2020年11期
关键词:检验预测模型

张卯红 南京市浦口区中心医院

1 引言

随着时间序列应用日益增多,时间序列预测,尤其是在未来的趋势预测。获得越来越多的关注。实现趋势预测的挑战在于实时提取时间序列的趋势特征与合理的预测模。本文回顾分析我们医院近6年急诊患者数据,应用自回归滑动平均混合模型(ARIMA)时间序列模型方法进行分析,试图探索预测急诊患者的时间变化规律,可为管理者平衡工作量,合理安排临床工作,实现弹性排班,优化人力资源配置,提供有益的辅助决策,同时提供如何建立相应数据模型方法步骤,供其他医院分析参考。

2 时间序列介绍

2.1 ARIMA模型

ARIMA模型,全称为自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,简记 ARIMA),是 指 将 非 平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。该模型主要用于预测和拟合时间序列数据的趋势,其作用是建立平稳时间序列的模型。在该模型当中,融合了移动平均模型、自回归模型等。对于系统中过去噪声、过去模式等方面的记忆,能够进行分别描述。在该模型的相关系数算法中,矩方法和极大似然估计方法是其中应用较为广泛的算法。

3 资料和方法

3.1 数据来源

通过后台抽取2012年一2017年医院急诊患者人数,其中2012—2016年数据用于建立时间序列模型,2017年数据用于验证所建立的模型。

3.2 研究方法

本研究采用R语言统计软件forecast,tseries包,运用ARIMA模型进行预测。ARIMA是Box-Jenkins方法中的重要时间序列分析预测模型。该模型试图应用相应的数学模型,将预测对象随时间推移形成的数据序列描述出来,并在该基础上选择合适的模型进行预测。实际运用中,首先通过平稳性和纯随机性检验进行序列预处理,然后确定ARIMA(p、d、q)模型中的3个参数,其中p为自回归的阶,d为差分次数的阶,q为滑动平均的阶,最后通过残差序列检验拟合模型是否有效,并可通过最小信息量准则(Akaike information criterion,AIC)和贝叶斯信准则(Bayesian information criterion,BIC)判断多个模型中最优模型。

3.3 数据分析

3.3.1 数据走势情况

根据导出的2012-2016年度数据,分析数据,R命令核心代码如下:1).ts_data2016 <- ts(data2016,frequency = 12,start=c(2012,1))2).ts_data2017 <- ts(data2017,frequency = 12,start=c(2012,1))3).plot(ts_data2017, main=" 急诊 人 数季度 走 势图 ", ylab=" 人数 ", xlab="时间 ")

从运行结果可以看人数逐年增长说明具有明显趋势性,为非平稳时间序列,需要进行差分平稳化,将非平稳时间序列转化为平稳时间序列。先使用diff()函数对时间序列作一阶差分,再使用tsdisplay()函数来观察。基本围绕了0在振动,基本平稳。进一步使用adf检验,看一下是否存在单位根(验证平稳性,若存在则不平稳),单位根检验通过(P=0.01<0.05,显著拒绝存在单位根)。形成(1,1,0)、(8,1,0)然后判断一下各自的AIC值,取最小值即可。

3.3.2 模型选择

平稳化过后,要根据时间序列模型的识别规则,对平稳序列建立相应的模型。在实际的分析过程中,我们主要通过forecast中的Auto.arima()函数来快速选择恰当的ARIMA模型,节省图形判断阶数的主观选择的,显示更为客观准确。

根据 BIC 准则,Auto.arima 提供的最佳模型为 (0,1,1)(0,0,1)[12],同时测试两个模型,看看预测的结果。首先进行拟合, 然后使用tsdiag()函数看一下两个模型的结果。两个ARIMA模型都采用极大似然方法估计,ARIMA(0,1,1)(0,1,1)

[12]:AIC = 707.4;ARIMA(0,1,1)(0,0,1)[12]: AIC= 885.29;fit1图中表明残差标准差基本都在[-1,1]之间,残差的自回归都为0(两虚线内), Ljung-Box检验的p值都在0.05之上,而且第一模型 AIC 值比第二个模型要小,因此选择模型 ARIMA(0,1,1)(0,1,1)[12]。

3.3.3 模型建立、预测及检验

根据参数估计得到的时间序列模型,我们可以对未来的序列值进行预测,并通过forecast()函数来实现,R核心代码如下:

模型预测2017年月度实际患者人数与模型预测值比较。模型预测值的动态趋势与实际情况基本一致,各月实测值均位于预测值95%可信区间范围。可以看出,实际增长值与预测的最高值基本吻合,说明我们急诊科患者人数正在快速增长,需要根据情况增派医护人员。

3.4 预测

通过上面建立好的模型,我们对2018年急诊患者人数做趋势预测。

模型预测2018年月度急诊患者人数,最高值达到九千人以上,把2018年1至6月份的实际急诊患者人数与之对比,数据相差无几,说明模型准确性很高。

4 讨论

本研究利用2012—2017年急诊患者数据,分别拟合了ARIMA(0,1,1)(0,1,1)[12]模型,并分析预测 2017 年的急诊患者人数情况,发现预测值与实际值较为吻合,可以应用该模型可以对2018年急诊患者人数进行预测。在实际应用中,由于所建模型是以历史监测数据序列为依据而建立的,因此需不断用新的监测数据对所建模型进行修正,以提高模型预测的精确度。

综上所述,时间序列分析可应用于临床,为资源和人员配置提供数据支持。通过对急诊患者数据短期预测,可以为今后急诊科合理安排临床工作,实现弹性排班,优化人力资源配置,提供有益的辅助策。如果想更好的服务临床工作,我们可以对数据进行细分,比如按科室统计、按时间段统计、按节假日统计,然后再进行预测,可能更好的服务于临床工作,更能合理实现弹性排班。此分析方法也可应用到全院各个病区,对医院做好整体规划提供理论支持、更合理安排医疗资源,有利于医院人员和物资的配备及调整。但使用的同时应考虑到,任何模型都有其局限性,再结合专业特点及其他影响急诊人数的因素进行综合分析。随着医疗卫生数据快速增长,如何从医疗大数据中发掘价值以服务于领导决策将是未来区域卫生信息化研究的重要方向之一 。

猜你喜欢
检验预测模型
无可预测
适用于BDS-3 PPP的随机模型
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
苯中水分的检验
选修2—2期中考试预测卷(A卷)
自制空间站模型
检验真朋友的新标准
模型小览(二)
小议离子的检验与共存