基于数据挖掘技术的教师团队研修模式探析

2016-03-06 06:27杨智宁祁敬伟
中小学教师培训 2016年9期
关键词:研修群文数据挖掘

杨智宁,祁敬伟

(1.北京大学数学科学学院,北京 100871;2.哈尔滨市香坊区教师进修学校,黑龙江 哈尔滨 150036)

一、引言

数据挖掘技术以其先进的智能化手段,从大量的数据中提取出有用的信息和知识,不断被银行、保险、交通、零售等商业领域所采用。随着中小学信息技术的普及和教育信息化进程的推进,数据挖掘技术开始逐渐向教育领域渗透。如何将数据挖掘技术有效地应用于教育活动,从大量的教育数据中发现隐藏的、有用的知识来指导教育、发展教育,成为一项具有重要实践价值的研究课题。近年来,学者们在教育领域中已经做出很多此类尝试,并在教学评价[1]、课程设置[2]、选课指导[3]等方面取得了初步的成效。

尽管如此,将数据挖掘技术应用于教师团队研修领域尚属空白。本文以数据挖掘技术为依托,以哈尔滨市香坊区小学语文“青青子衿”教师专业社群主题研修活动案例为背景,探讨基于数据挖掘技术的教师团队研修模式的实施目的、程序和成效。

二、教师团队研修的困惑

哈尔滨市香坊区小学语文“青青子衿”教师专业社群成立于2009年,该社群由祁敬伟名师工作室、优秀青年教师精英团队、各学年协作组三个层次组成,旨在通过问题研究、实践反思、同伴互助、自我研修等方式,建立区域间多维立体的教师网络研究共同体,促进各个层次的教师专业化发展。多年来,“青青子衿”教师专业社群立足小课题研究,取得了一定的成绩,但也遇到了不少亟待破解的难题。

1.主观性。以教研员为引领的教师研修团队,优势在于教研员能根据教师专业发展的需要,在教师的观念和行动上给予专业支持。然而,由于研修的主题是教研员确定的,活动的内容、形式、目标,都存在很大程度的垄断性和专制性,无法真正满足教师个体的研修需求,在一定程度上降低了团队研修活动的实效性。

2.盲目性。由于缺乏科学的调研、统计和分析,团队研修无法摸清一线教师的实际需求,因此,研修内容设计存在着一定的盲目性。在很多情况下,团队研修要么将网络、报刊上的时髦话题作为主要内容,要么是把教研员听课过程中发现的个别问题确定为团队研修的内容。这样的研修内容设计常会导致多方面问题,例如:研修内容跨度和随意性很大,教师无所适从;内容陈旧无趣,费时低效。

3.虚假性。现有的教师团队研修活动,常常呈现异彩纷呈、热闹非凡的态势。课堂教学问题的呈现、教师观念的交流与碰撞,使研修现场十分活跃。如果仅仅看到这些现象,多数人都会认为这样的研修活动方式好、内容新、参与广、实效佳。然而,冷静思索一下不难发现,活跃的仅仅是现场的少数人,而多数参与者仍然处于被动、沉默的状态,究其原因,主要是他们的兴趣、问题等并没有被充分关注,因而只能在团队研修活动中充当看客或疲于应付。

上述这些弊端的存在集中说明了一点:教师团队研修要想取得实效,不仅需要准确地把握教师们的研修需求,而且还需要选择非常务实的研修方式。那么,如何才能科学地确定教师们的研修需求?究竟怎样选择有效的研修方式?这些都是难以解答的问题。仅就第一个问题来看,正确把握教师研修需求是一个非常复杂的过程,因为不仅每个教师的研修需求不只一种,而且群体教师的研修需求更是呈现多样化的特点。因此,对于教师团队研修的组织者来说,有必要在研修过程中对教师的研修需求进行充分调研,并且运用某种适当的技术手段对调研所获得的数据进行科学分析,进而从纷繁复杂的信息与数据中识别教师研修的核心需求。数据挖掘技术就是解决这个问题的最好技术手段。

三、数据挖掘的概念及常用方法

(一)数据挖掘的概念

数据挖掘就是从海量的数据中采用自动或半自动的建模算法,寻找隐藏在数据中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘技术的功能与特点可以用趋势(Trend)、模式(Pattern)及相关性(Relationship)等几个关键词来形容。可以说,数据挖掘技术也是一种决策支持的手段。

(二)数据挖掘的常用方法

1.分类分析。分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类。其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别中。如果将这种分类分析的方法用于教师团队研修的活动中,那么它会使培训调研中所获得的包罗万象、杂乱无章的需求信息变得有序和结构化,便于培训者把教师的研修需求归纳为几个大类,进而从宏观上把握教师的研修需求究竟有哪些方面。

2.回归分析。回归分析可以反映数据库中数据属性值的特性,通过使用函数表达数据映射的关系来发现属性值之间的依赖关系。在指导团队研修活动中,它可以被应用到对数据序列的预测及相关关系的研究中去。

3.聚类分析。聚类类似于分类,但与分类的目的不同,是针对数据的相似性和差异性将一组数据分为几个类别。在处理团队研修多样化需求的数据的过程中,运用聚类分析的方法,就会便于我们发现属于同一类别的数据间较大的相似性,也便于我们发现不同类别数据间很小的相似性,还便于我们发现跨类的数据间很低的关联性。

4.关联分析。关联分析是隐藏在数据项之间的关联或相互关系,即可以根据一个数据项的出现推导出其他数据项的出现。团队研修关联分析过程主要包括两个阶段:第一阶段为从海量原始数据中找出所有的高频项目组;第二阶段为从这些高频项目组中提取出关联规则。

将上述方法用于教师团队研修过程中,实际上就是通过精细化、科学化的分析技术,使得研修组织者在面对大量的教师研修需求信息时保持理性,最终一步一步地逼近教师团队研修的核心需求,并确定有针对性的研修内容和方式,从而大大提升教师团队研修的效果。

四、数据挖掘技术在教师团队研修中的应用

2015年1月,哈尔滨市香坊区小学语文“青青子衿”教师专业社群准备开展一次小课题研修活动,即“群文阅读教学实践与策略研究”。怎样确定这次的小课题研修的具体内容和方式?这是我们在研修开始前一直在思考的问题。

为了破解以往小学教师专业社群在小课题研修过程中存在的主观性、盲目性和虚假性等难题,更好地发挥小课题研究工作的针对性和实效性,我们在研修开始之前对所有参与研修的教师进行了需求调研,随后运用了数据挖掘技术对调研所获取的信息进行了处理和分析,最终形成本次小课题研修的具体内容和方式,从而摸索出一种新颖、有效的团队研修模式,下文将对我们的做法进行介绍。

(一)研修前:运用数据挖掘技术制订科学、合理的团队研修计划

我们的研修模式是一种基于自主研习的教师研修模式。因此,在将数据挖掘技术引入我们的研修模式之后,研修计划的生成比以前有了很大的改进,其操作程序如下:

1.自我研习。在研修开展的准备阶段,我们首先带领并号召教师采取各种方式进行自我研习,以便让每一位教师充分思考“群文阅读教学”方面的问题,发现自己的兴趣点和研修需求。

2.问卷调查。问卷调查在哈尔滨市香坊区小学语文教师中进行,共收到10组397份调查问卷,目的是了解教师对“群文阅读教学”的基本认识、教师个人的读写素养、教师在阅读教学过程中的习惯、能力、水平,以及教师目前的学习方式等。

3.数据挖掘。为了分析教师素养、教学行为和学习方式三者之间潜在的相关性,我们用关联规则对问卷中的数据进行挖掘。关联分析的常用算法被称作Apriori算法[4],其操作流程参见图1所示。根据这个算法,我们对相关数据进行分析,分别找出一、二、三、四项的频繁项集,从而挖掘出在团队研修活动中最重要的四个相关项目,以确定研修的主题及形式。

图1 以Apriori算法进行数据挖掘的过程

通过数据挖掘,我们在12个项目中发现了两组四项频繁项集,也就是说,在促进教师专业发展的活动或因素中,这两组中每组的四个项目相关性最大。如果在团队研修过程中,充分将它们加以融合,必然能够提高研修的针对性和有效性。为此,基于上述数据挖掘的结果,我们制订了此次研修计划。

4.形成判断。在运用数据挖掘技术对10组原始调研统计数据进行处理后,我们就会得到如图2所示的结果。

从总体上来看,以上研修计划将提高教师专业能力最相关的两组四个渠道进行充分融合,从而力使教师团队研修发挥最大的功效,真正解决教师们在群文阅读教学方面遇到的困惑和问题,全面改进小学语文群文阅读教学,同时也大大促进了团队研修模式的创新。在这个过程中,数据挖掘技术的运用甚为关键。

(二)研修过程中:利用数据挖掘技术改进研修方式,将教师研修内容引向深入

图2 “小学语文群文阅读教学调查问卷统计表”数据挖掘的过程及结果

由上可见,在数据挖掘基础上制订的研修计划更加具有针对性和相关性。但是,这仅仅是确保高效研修的必要条件而非充分条件。进一步值得探索的问题是:教师如何对每一个研修内容进行深入研究?也就是说,教师在研修过程中如何做才是研修成功的关键所在。以往的研修中,教师们存在着盲目、忙乱、浅尝辄止等问题,对所研修的问题要么因抓不住核心而面面俱到、浅尝辄止,要么略谈一二、以偏概全,从而无法达到对所研修问题的深入、全面理解。为了解决这些问题,我们在教师研修过程中也引入了数据挖掘技术,下面以“群文阅读要‘读’出什么”团队主题研修为例,来具体地谈一下基于数据挖掘技术的团队研修活动的开展情况。

第一步:研修活动的准备

1.注重对学生水平的了解

(1)调研测试。研修者对一个教学班54名学生阅读情况进行测试,了解学生的阅读水平。

(2)数据挖掘。为了了解学生特征,我们用聚类分析的常用方法K—均值法[5](参见图3)对54名学生进行聚类分析。其流程是:先抽取4名学生的数据,分别作为聚类的起点;然后通过计算距离,指派与他们数值相近的学生构成4个簇;最后通过比较各簇的特点得出结论。

(3)得出结论。将聚类信息进行分析,我们可以得出班级中四组学生的特征,从而判断出他们在阅读学习上的优势与不足,为更好地设计教学活动提供了方向。

2.注重学生的需要,使教学设计有针对性

根据数据挖掘的学生情况,我们在设计该班群文阅读教学《奇妙的巨人童话》时,确定了以下教学目标:

(1)找出文中的重点语句画情节图。

(2)默读群文里的四篇关于巨人的文章,体会读巨人童话的学习方法。

(3)自己设计情节图,运用不同的表达方式来创编一篇巨人童话。

(4)通过本堂课巨人童话的群文阅读,拓展延伸,激发学生课外阅读童话的兴趣并愿意和同学交流阅读的感受。

数据挖掘技术下教学目标的确定,使教师能够更加科学地站在学生能力、水平的起点上设计教学。它遵循了群文阅读教学通过文本学语言运用的规律,使学生在文本学习的过程中了解了巨人童话的特点,夯实了基础,强化了记忆,并在“比较——发现——运用”的学习活动中,锻炼了分析能力和想象能力。

3.注重信息的发布,使教师做好研修准备

团队研修活动前一周发布本次研修的信息,将研修目的、主题、内容、形式、教学设计及作业等提前让教师知晓,促使教师带着信息、带着理念、带着思索、带着期待、带着困惑,参与学习。

第二步:研修活动的进行

1.注重现场观测,获取真实数据。课堂教学现场,每一个情境都是团队研修的例子。教学活动中教师的状态、学生的表现是我们评价一节课的重要依据。为此,我们制订了观测量表,其中教师四个方面、学生六方面,每个方面的权重均为10。运用观测量表,使听课教师能够细致观测,从而有针对性地对课堂教学的现象进行分析。

依据全体教师的观测统计情况(参见图4),我们不难看出本节课在教学目标的达成、学生倾听的习惯、积极互动的氛围、愉快的情感状态四方面得到了教师们的认可,而在教学过程、学生合作两方面争议最大。

2.实施有效交流,生成研修交往。针对教学过程的可行性,以及学生如何进行合作学习两方面进行研讨交流。

3.梳理研修成果,达成研修共识。将现场团队研修和网上研讨的要点整理出来,发布到QQ群里。

图3 K—均值法进行数据挖掘的过程

图4 群文阅读《奇妙的巨人童话》课堂教学观测统计图

以上基于主题实践的团队研修活动,通过“数据挖掘——了解学生——确立教学目标”,再通过“观测课堂——统计观测数据——确定研讨话题”,最后通过“研讨碰撞——总结成果——发布成果”达成研修成果的资源共享。

实践表明,相比较于常规教研而言,基于数据挖掘技术的教师团队研修模式具有很多优势。既往的团队研修模式,无论是同课异构,还是问题辩论,抑或是经验分享式等,在科学性、针对性和实效性等方面都无法与基于数据挖掘技术的教师团队研修模式相媲美。

五、结语

(一)经验总结与分享

将数据挖掘技术应用到教师团队研修中,从中发现隐藏的、模糊的、有价值的信息,不仅能够给研修团队提供教育中值得研究的问题,跟踪、挖掘、预测出学生、教师的水平和关注点,而且能够在研修过程中不断通过新生成的数据,使研修教师把握研究的状态,更加科学、多元地进行研修活动,从而提高团队研修的效益和教师的专业化水平。关于将数据挖掘技术引入团队研修活动,有以下几点体会值得分享。

1.团队研修活动前期的充分调研,是获得数据挖掘信息判断的重要依据。

2.将数据挖掘技术运用于团队研修的不同阶段,所采用的方法和起到的作用是不同的。数据挖掘技术中的回归分析使教师团队研修活动中的各种行动和方式达到最优化。数据挖掘技术中的决策树技术,能够帮助我们减少教学的盲目性,防止学习过程中出现不必要的困难与波折,因而大大地提升了研修的效率。

3.数据挖掘不同于简单的数据统计,它是计算机专业知识在实际应用中的辅助作用。数据挖掘技术越专业,方法越实用,挖掘出来的信息越有价值。

(二)需要进一步研究的问题

然而,将数据挖掘技术应用于改进教师团队研修只是一个初步的探索,我们也遇到了一些困惑和问题:

1.关联分析和聚类分析属于计算机等领域的常用方法,将他学科的理论与方法引入教育领域要考虑是否合适的问题。相对计算机学科来说,教育是一个多元的、复杂的、模糊的行为,因此,如何让关联分析和聚类分析更加细化、分支更加全面、操作更加简洁等需要进一步研究。

2.数据挖掘技术由于其专业性较强,目前只有少数专业人员能够进行操作。如何开发出便于教师、教研人员操作和理解的工具和方法,形成稳定的、常态的研修模式,这是值得我们以及所有致力于改进教师团队研修的同仁们继续努力的方向。▲

猜你喜欢
研修群文数据挖掘
中小学骨干教师“双减”项目式研修模式探索
群文阅读教学模式探讨
一主六维:深度卷入的研修模式
探讨人工智能与数据挖掘发展趋势
谈以生为本的群文阅读教学策略
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
初中群文阅读的文本选择及组织
“研训导一体化”教师研修方式的实践与探索
群文活动
高级数据挖掘与应用国际学术会议