大数据背景下时间序列分析课程的教学改革探索

2022-05-24 11:00习丽
高教学刊 2022年13期
关键词:时间序列分析R语言案例教学

习丽

摘  要:时间序列分析是一门应用性较强的统计学专业课程,在大数据背景下,必须进行教学改革,提高教学效果,才能培养出大数据时代所需要的统计人才。文章从优化教学内容、探索课堂教学方法、完善考核模式三个方面探索该课程的教学改革。

关键词:时间序列分析;课堂教学;R语言;案例教学

中图分类号:G642       文献标志码:A          文章编号:2096-000X(2022)13-0014-04

Abstract: Under the background of Big Data, the course of Time Series Analysis is a practical statistical one. We must carry on the teaching reform and improve the teaching effect in order to cultivate the statistical talents needed in the Big Data era. This paper explores the teaching reform of the course from three aspects: optimizing the teaching content, exploring the classroom teaching method and perfecting the examination mode.

Keywords: Time Series Analysis; classroom teaching; R language; case teaching

大數据是指随着现代社会的进步和信息技术的发展,在政治、经济、社会等各个领域形成的规模巨大,增长与传播迅速,形式复杂多样、非结构化程度高的数据或数据集[1]。大数据时代,绝大数的信息都是由数字表达出来的,数据既是信息的载体,更是统计学研究问题和分析问题的对象。统计学研究的数据主要有静态数据和动态数据两种,分别利用多元统计分析、时间序列分析方法来研究[2]。

时间序列分析是统计学专业的必修课程,通过对动态数据进行观察、研究,寻找数据内在的规律,建立有效适当的统计模型,并预测其将来的走势。在日常生活中,时间序列比比皆是,如今时间序列分析方法广泛应用于经济、天文、农业、气象、生物、质量控制等诸多领域,成为众多行业经常使用的统计方法[3]。

大数据时代,统计人才的需求量越来越大,对人才的能力要求也越来越高。传统的教学模式已经无法做到“与时俱进”,只有不断地探索时间序列分析课程的教学改革,才能培养满足大数据时代所需求的统计学专业人才。

一、大数据背景下时间序列分析课堂教学中存在的问题

时间序列分析作为高校统计学专业的必修课程,是统计学专业的一个重要分支 。传统的“一支粉笔,走遍天下”的教学方法理论教学比例太大,实践环节较少。课堂上教师很容易“迷恋”上理论推导,变得枯燥无味,学生实际操作能力弱,解决实际问题的能力无法满足大数据时代的要求,无法培养大数据时代所需要的统计人才。

在大数据背景下,探讨时间序列分析的教学改革,对培养数据分析人才具有重要的理论价值及现实意义。对时间序列分析这门课程进行教学改革,目的是培养专业的数据分析人才,满足大数据时代的需求。

二、优化课堂教学内容:重视学科史,增加模型背景的教学内容

课堂教学是教师向学生传授知识的一个重要环节和途径,有必要在课堂教学中简要介绍时间序列分析的历史演变发展过程,在知识学习中融入时间序列分析的学科史,增加模型背景的教学内容,有效调动学生的积极性,更易于激发学生对本专业的热爱,激发学生学习时间序列分析方法的兴趣。

学科的演变过程是在不断地发现问题和解决问题的过程中实现的,这与个人发展相类似,对学生的思想品质产生一定的影响,在人生之路上要树立目标,努力解决问题,不断实现更好更优秀的自己。实现立德树人,把思想政治工作融会贯通于教育教学的全过程,推动全程育人。如何简要介绍时间序列分析的历史演变过程呢?笔者根据多年讲授积累了丰富的经验,简要叙述如下。

(一)描述性时序分析的阶段

约7000年前,尼罗河涨落的情况被古埃及人逐天记录下来,形成了世界上最早的时间序列。早在我国春秋战国时期,范蠡等提出“六岁穰,六岁旱,十二岁一大饥”的自然规律。经过几十年持续的观察和记录,德国业余天文学家、药剂师S.H.Schwabe最终发现太阳黑子活动有11~12年的周期性规律。

对时间序列的早期分析,主要依靠对数据的直观比较或简单的绘图观测,探寻序列中所隐含的发展规律,被称为描述性时序分析,是时间序列分析的初始阶段。随着研究领域越来越宽,起初单纯的描述性时序分析的方法越来越不能满足需求。后来伴随概率论中随机变量的发展以及统计学中一些方法的逐渐提出,时序分析开始关注随机序列内在本质的相关关系,统计时序分析的新时代因之诞生。

(二)统计时序分析的阶段

频域分析方法和时域分析方法是现代时间序列分析的两大类。

1. 频域分析方法简介

1906年德国学者Arthur Schustrt提出的周期图方法是频域分析的开端。谱分析方法具有很高的数学门槛,且需要的数据量与计算量都非常大,且结果不易进行直观解释,使用主要局限在某些特殊领域,比如:地震研究领域,文学,海洋学等[4]。

2. 时域分析方法简介

1927年英国统计学家G.U.Yule首创的2阶自回归模型AR(2),公认为时域分析方法的起源。一般时域分析方法主要是从序列自相关的角度来揭示时间序列的发展规律。后来Gilbert Thomas Walker把AR(2)模型扩展到一般的AR(p)模型。Evgeny  Evgenievich  Slutsky创建了滑动平均MA(q)模型。在1938年,瑞典计量经济学家和统计学家Herman Wold提出了Wold分解定理,是现代时间序列分析理论的灵魂,是拟合平稳序列的基础。瑞典著名的统计学家和保险精算家Harald Cramer将Wold分解定理进行推广,得到了Cramer分解定理,它是非平稳序列的分解理论,是构造ARIMA模型的理论基础。Cox和Jenkins讨论了非平稳自回归滑动平均模型ARIMA,通过适当阶数的差分可以将非平稳时间序列变为平稳时间序列,可以建立ARMA模型。随着时间序列研究的逐渐深入,经典模型在应用上的局限性随之显现。统计学家们纷纷转向多变量场合、异方差场合和非线性场合的时间序列分析方法的研究,并取得了一些重大进展,例如,向量自回归模型(VAR)、广义自回归条件异方差模型(GARCH)等。

三、大数据背景下课堂教学方法的探索和改革

大数据时代我国的高等教育正面临着日新月异的变革。传统的教学模式难以顺应大数据时代的变化,必须探索时间序列分析教学方法的改革与创新,以积極适应信息爆炸式增长的大数据时代。主要从以下三个方面来介绍时间序列分析课程的教学方法的改革。

(一)重视多元化教学模式

随着互联网技术的快速发展,当代大学生对网络的依赖程度日益增强,获取知识的途径和方式呈现多样化,催生了慕课、网课、微课、翻转课堂,教育资源云服务等,这些新兴的多元化教学模式,对时间序列分析课程教学改革起到了更好的推动和促进作用,成为时间序列分析课程教学方法改革的必然趋势。

微课又被称为“碎片化”教学,10分钟左右的教学视频,短小,精悍,学生在移动设备上即可完成。比如,在介绍时间序列分析的三大经典模型的结构时,学生可以在老师的指导下提前通过微课来学习,多角度呈现结构特点,容易掌握所学内容,激发学生的学习热情。慕课是大规模网络开放课程,是“互联网+教育”时代的产物。线性差分方差对学生来讲,理解有一定难度,要求学生课前在慕课网站上自主学习教学内容,课堂上教师通过提问、小测验、分小组进行讲解等方式,来检验学生对知识的掌握情况,再有效开展课堂讲解的内容。

(二)重视案例教学及实践教学

传统的教学中,重视理论知识的讲解、方法的数学推导,脱离了大数据时代培养应用型人才的现实,从而导致学生很难将所学的理论知识和方法与实际问题结合起来。因此,探索时间序列分析课程的教学改革必须注重课程的实用性,提高学生的课堂参与度,引导和启发学生独立思考,让学生能够把分析动态数据的方法应用到实践领域,实现这一目标的关键是在课堂教学中引入案例教学。通过对具体案例的分析,引导学生自主探究式学习活动的开展,以提高学生分析和解决问题的能力[5]。

案例的选取通常来自两个方面:一方面来自所选教材,我们常用的《时间序列分析——基于R》一书案例数据丰富,难易适中,适合初学者;另一方面以实践教学的形式获得的数据。大数据时代,具体真实案例的数据获得不那么难了,在指定网络下载统计年鉴的数据也很方便快捷。将学生分成小组,设计一个调查方案,比如调查某商场市场销售情况,某城市拥有汽车辆数、国民收入情况等,搜集到数据,整理后利用时间序列分析的方法对数据进行分析,得到结论,并撰写分析报告。学生通过这样的实践教学环节,对动态数据资料的搜集、整理、分析的每一个环节都会有不同的体会,发现问题,分析问题、解决问题的能力有进一步的提高。

在讲授平稳序列建模时,根据1950-2008年我国邮路及农村投递路线每年新增里程数序列,选择合适的模型进行拟合。如何开展这项工作呢?怎样才能找到合适的模型进行拟合呢?具体方法如下。

1. 平稳非白噪声检验

我国邮路及农村投递线路每年新增里程数序列时序图如图1所示,该序列没有明显的趋势性和周期性,始终在一个常数值附近随机波动,而且波动的范围有界,初步判断序列没有显著的非平稳特征。序列的自相关图如图2所示,只有延迟1~3阶的自相关系数在2倍标准差范围外,其他延迟阶数的自相关系数都在2倍标准差范围内波动,可以判断该序列具有短期相关性,进一步确定序列是平稳。R语言中调用Box.test函数进行白噪声检验,得到延迟6阶、12阶的两个LB统计量,p值分别为1.255×10-6和1.197×10-5,都小于显著性水平?琢(?琢=0.05),可以有很大的把握断定此序列彼此之间蕴含着相关关系,为非白噪声序列。

2. 计算ACF,PACF

由图2自相关系数(ACF)衰减到零的过程,看到明显的正弦波动轨迹,自相关系数衰减到零不是一个突然的过程,而是一个连续渐变的过程,这是自相关系数拖尾的典型特征。通过图3序列的偏自相关系数(PACF),可以得到偏自相关系数衰减到零的过程,除了延迟1~2阶的偏自相关系数在2倍标准差范围之外,其他延迟阶数的偏自相关系数都在2倍标准差范围内,这是一个偏自相关系数2阶截尾的典型特征[3]。

3. ARMA模型识别

根据自相关系数拖尾,偏自相关系数2阶截尾的属性,初步确定拟合模型为AR(2)。R语言提供了自动识别模型阶数的函数auto.arima,自动定阶结果是AR(2),这与根据自相关图和偏自相关图定阶的结果一致。

4. 估计模型中的未知参数

利用极大似然估计方法确定我国邮路及农村投递路线每年新增里程数序列的模型为:

5. 模型检验

模型的显著性检验就是检验模型的有效性,即对残差序列进行纯随机性检验。延迟6阶和12阶的LB统计量的p值分别为0.910 8和0.996 6,显著大于0.05,认为这个拟合模型的残差序列属于白噪声序列,该拟合模型显著有效。

6. 预测序列未来的走势

预测主要是利用序列所观测到的样本值,对序列未来某个时刻的取值进行估计。利用R语言中的forecast函数完成预测工作。如图4所示,给出了序列的预测值及预测值的区间估计。

(三)重视统计软件学习

时间序列分析课程中对具体案例操作时,实际数据量较大,仅靠手工计算很难完成,需要借助于计算机软件,所以必须熟练掌握一门统计软件。目前,最常见的计量经济学软件是Eviews,计量功能强大,简单易学。而R语言是当前流行的统计软件,资源丰富,功能十分强大。与Eviews相比,R语言的优势体现在以下三点:(1)R语言是开源的,免费的;(2)R语言能够在多种操作系统下运行,如Windows系统,Linux和Macos系统;(3)R编程语言更为通用并且可以下载最新的软件,实时更新最新的统计分析方法,加快研究效率,互动性更强[6]。

课堂上,教师可利用R语言进行数据的可视化教学,更加直观、生动地展示给学生,使得课堂上所學的理论、案例分析、统计软件三者有机结合起来了,对理论知识的学习不再那么枯燥了,对统计思想的理解更加深刻了。

学生在学习R语言的过程中,掌握基础入门操作后,可以通过下载不同的程序包来实现多种功能,借助帮助指令能够让学生有更多的自我探索,自我学习的机会,最大限度地发挥学生的主观能动性,以软件学习促进理论学习,学以致用,获得更优的学习效果。

R语言开放、高效的特点正契合了大数据时代,契合了当代大学生学习方法变化的特征,为时间序列分析课程的教学改革提供了强而有力的支撑。

四、完善考核模式

课程考核是教学过程中的一个重要环节。时间序列分析是一门应用性很强的学科,以提高学生的综合素质,同时具备处理实际问题的能力,所以课程考核不仅是简单的理论知识的考核,还要增加对实际应用能力环节的考察,且考察的方式可以多样化,举例如下。

1. 试验报告:通过布置一些基本的习题,主要考查学生对基本的时间序列分析方法的掌握情况。通过上机操作,对给定数据进行处理、分析、预测,形成试验报告。

2. 课程论文:要求1~3人组成一组,结合所学的理论知识来研究某实际问题,题目自选,从收集数据、处理数据和分析数据开始,到最后形成论文都以学生自己为主。有效地将课堂教学与课外学习有机地结合起来,培养了学生主动学习和自主学习的能力。

大数据时代的到来,高校的每个学科都面临着知识量爆炸式增长的挑战,如何上好时间序列分析这门课仍任重道远,每位统计学专业的老师都应转变教学理念,改变重理论轻实践的思想,具备较高的软件操作能力,加强实践环节,在时间序列分析课程的教学改革方面积极探索,培养大数据时代所需要的统计人才。

参考文献:

[1]李璐.基于数据挖掘的量化选股策略的研究[D].天津:天津商业大学,2017.

[2]徐宝,腾飞.新形势下时间序列分析课程教学模式的探索与实践[J].吉林师范大学学报(自然科学版),2011,32(1):140-142.

[3]王燕.时间序列分析——基于R[M].北京:中国人民大学出版社,2012.

[4]易丹辉、王燕.应用时间序列分析[M].北京:中国人民大学出版社,2015.

[5]王烨,张修梅.案例教学法在高等数学课程中的运用[J].内江科技,2020,41(1):43+67.

[6]李泓征,刘妍.基于R语言的《金融时间序列分析》课程教学改革与实践[J].时代金融,2019(9):223-224.

猜你喜欢
时间序列分析R语言案例教学
基于GPS轨迹数据进行分析改善城市交通拥挤
基于R语言的Moodle平台数据挖掘技术的研究
基于R软件的金融时间序列的预测分析
案例教学在机械创新设计课程中的应用
马克思主义基本原理概论课案例教学的几点思考
EXCEL在《投入产出法》案例教学中的应用
《运筹学》教学模式探讨
基于R语言的湖南产业结构对其经济增长贡献分析
注重统计思维培养与应用为主导的生物统计学课程建设
微信公众号未来发展态势的实证预测