区域教育大数据中心平台建设探讨*

2016-10-14 14:22徐超超陈世超赵鑫硕杨现民
现代教育技术 2016年11期
关键词:数据中心智慧区域

徐超超 陈世超 赵鑫硕 杨现民



区域教育大数据中心平台建设探讨*

徐超超 陈世超 赵鑫硕 杨现民

(江苏师范大学智慧教育学院,江苏徐州 221116)

智慧教育正在引领新一轮区域教育信息化发展与改革的浪潮,而教育大数据是实现区域教育系统“智慧化”升级改造的基础。文章在定位区域教育大数据中心平台价值的基础上,重点对区域教育大数据中心平台的架构进行了设计,并对平台建设与运营中存在的三大关键问题——教育数据的适度开放、教育数据的全面治理、教育数据的创新应用进行了初步探讨,期望能够为各地区教育大数据中心平台建设提供一定的指导和参考。

智慧教育;教育大数据中心;区域教育信息化;平台建设

智慧教育是信息技术与教育发展高度融合而产生的新型教育模式,是国际教育信息化发展的新方向[1]。2014年8月,国家发改委、财政部、住建部等八部委联合发布《关于促进智慧城市健康发展的指导意见》,提出到2020年建成一批特色鲜明的智慧城市。智慧城市建设工程的启动与大力推进,为区域智慧教育的发展提供了契机。目前,国内一些信息化先行城市(如北京、上海、宁波、深圳等),已开始着力推进区域智慧教育发展规划与建设方案的制定及实施。智慧教育正在引领新一轮区域教育信息化发展与改革的浪潮,从数字化教育走向智慧教育已成为时代发展的必然要求[2]。教育大数据是实现区域教育系统“智慧化”升级改造的基础,教育数据挖掘和学习分析技术是连接教育大数据与智慧教育的桥梁[3]。海量数据的汇聚与深度挖掘,将赋予教育系统“大智慧”,促进教育决策科学化、教学环境宜人化、教学模式个性化、教育管理智能化、教学活动智慧化。在大数据时代,教育数据有望成为推动教育系统创新与变革的重要力量,教育发展与改革正在走向“数据驱动”模式。

当前,区域教育信息化的建设正在逐步走出“重建轻用”的泥潭,走向“应用驱动”的发展模式。应用系统的按需建设及其与教育教学实践的深度融合,成为了区域教育信息化发展的战略目标。国内已有学者分别对区域智慧教育云服务体系[4]、智慧教育云平台构建方法与技术[5]、区域教育资源共建共享平台[6][7]、城市终身教育公共服务平台[8][9]等进行了初步探讨。然而,随着大数据理念的传播和教育数据资产意识的增强,如何有效管理区域教育数据、如何构建区域教育大数据中心平台、如何实现区域教育大数据的运营与创新应用等,这些现实问题在各地区推进区域智慧教育发展的过程中仍有待解决。基于此,本研究将分析区域教育大数据中心平台的价值定位,重点设计区域教育大数据中心平台的架构,并对平台建设与运营中的关键问题进行初步探讨,期望能够为各地区教育大数据中心平台的建设提供一定的指导和参考。

一区域教育大数据中心平台的价值定位

区域智慧教育的健康发展离不开信息化平台的支撑。当前,国内诸多地区已启动智慧教育综合服务平台的新一轮规划与建设工作。区域智慧教育综合服务平台是在智慧教育理念的指导下,全面支撑区域智慧教育业务开展,采用一体化架构、可灵活扩展的信息化系统,包含若干支撑具体教育业务开展的应用系统[10]。要实现各应用系统的有效集成和数据共享、为教育决策的科学制定提供可靠数据支撑,就需要建立以教育数据管理和利用为核心业务的教育大数据中心。区域教育大数据中心平台的价值定位主要体现在如下几个方面:

1 教育大数据中心是智慧教育综合服务平台的“核心模块”

教育大数据中心是大规模数据存储和信息流通的中间节点,为全区提供教育数据共享服务。其首要任务是从各个数据源集成数据并保持同步更新,保证区域教育数据采集与交换的及时性、完整性和一致性,成为各个应用系统之间的共享数据通道,有效解决区域教育信息化发展过程中长期存在的“信息孤岛”[11]问题。

2 教育大数据中心是区域教育事业快速发展的“战略资产”

在大数据时代,数据逐渐成为一种无形的资产[12]。以美国、英国、法国等为代表的发达国家率先将大数据作为新型战略资源,视其为“未来的石油”。而在教育领域,西方发达国家也已先行一步,纷纷加速部署教育大数据战略,强化教育大数据战略资产意识。教育大数据中心通过持续汇聚海量的教育数据,将成为区域教育发展与改革的强大动力和重要资本,并有助于催生教育数据相关产业,带动区域经济的发展。

3 教育大数据中心是破解教育发展与改革难题的“科学力量”

教育大数据是一座可无限开采的“金矿”,对其进行深度的挖掘与应用是实现数据“资产”增值的重要途径。当前区域教育发展面临均衡发展、质量提升、减负、择校等诸多难题,教育大数据中心可提供科学的数据分析与决策支持为其寻求有效解决之道。教育大数据中心不仅是数据的汇聚中心,更是教育“智慧”的创生中心。基于教育数据提供各种智能化的教育应用(如智能统计分析、教育发展评估与危机预警、教育决策支持等),是教育大数据中心的核心功能。

二区域教育大数据中心平台的架构设计

1 体系架构

为了实现全区教育数据的规范管理,保证数据在不同的系统间能够根据需要快速、安全共享,就需要将重点放在教育大数据中心的建设上。本着“数据一致,按需共享”的原则,本研究设计了区域教育大数据中心平台体系架构,如图1所示。

图1 区域教育大数据中心平台体系架构

数据采集与存储是区域教育大数据中心平台的基本功能。教育大数据中心的数据源主要来自众多子信息化应用系统,包括已有的系统和新建设的系统。为了保证数据的一致性,教育大数据中心与应用系统数据源间的数据必须通过手动或自动实现数据更新——原有系统由于在建设之初没有严格按照相关教育信息化标准进行建设,采用的技术路线、架构模式多不相同,造成了数据交换上的困难,因此进行数据更新时需要首先采集数据,然后对数据进行规范化格式转化,生成符合信息化标准的数据格式,最后数据入库,实现异步数据更新。新建系统可以采用Web Service技术开发,数据结构要严格按照教育信息化规范设计,并通过XML更新文件动态觉察信息化应用系统的数据变化,实现同步更新。教育大数据中心所有的数据要严格按照教育信息化标准(如教育资源建设标准、学习对象元数据标准、教育管理信息系统规范、教育信息系统互操作规范等)进行建设,不符合规范的数据需要经过数据整理方可进入教育大数据存储中心;同时,应用先进的云存储技术,构建海量异构数据资源存储体系,分类存放各种结构化、半结构化和非结构化的过程数据、预测数据、汇总数据等。

系统结构的上端分别是区域教育大数据的管理中心和挖掘中心。其中,管理中心负责对采集到的结构化、半结构化以及非结构化教育数据进行系统管理,核心功能包括元数据管理、主题管理、数据采集、数据存储、数据同步、数据交换、安全管理、角色与权限管理、运营管理、系统设置、教育数据挖掘、可视化分析与呈现等。通过前端的管理界面,可实现对教育数据的简单、快捷、可视化管理,提高数据管理的透明度和数据管理的效率。挖掘中心则旨在根据教育业务的发展需求,制定合适的挖掘策略,灵活采用各种数据挖掘工具与算法,对现有教育数据进行深度挖掘与分析。挖掘中心是实现教育数据价值的关键,除了基础的报表统计分析,还提供教育发展趋势预测、关联分析、资源智能归类、师生聚类分析等多种高阶数据处理应用,分析的结果通过可视化方式直观呈现。

2 主题库

教育大数据中心作为全区教育信息存储、流通、共享的关键系统,设计时应尽可能地涵盖区域教育部门的所有关键信息。针对不同的业务需求,区域教育大数据中心应包含不同的主题库,各主题库又可包括若干细分的子主题库;同时,主题库中应有若干个数据表,以存储来自不同应用系统的数据,其主题库列表如表1所示。

3 核心功能

(1)元数据管理

这里的元数据是指管理系统中各数据表及字段的真实涵义。元数据管理主要完成对教育大数据中心数据库结构的管理维护工作,即对教育大数据中心标准表的原数据进行登记,以方便日后的数据管理,具体功能包括表的注册、字段注册、数据库结构更新等。另外,在元数据的管理中还涉及元数据的分类,即根据信息子集的分类,将标准库分成业务人员熟悉的类型,以方便业务人员查找。对于某些需要特别关心的数据可以进行CheckPoint记录,以便跟踪和统计——这主要针对的是一些敏感数据,需要知道其来龙去脉,如有哪些人在哪些时间进行了哪些操作,记录下来以便日后查找。

(2)主题管理

主题管理包括主题库的建立和主题对象的管理。针对某一主题的相关信息一般并不是从唯一的一个库里面获取的,故若想全面利用信息,就需要构建一个综合性的主题库。比如,对一个教师来说可形成一个数据主题,即与该教师相关的信息集成——人事管理系统中有基本信息、档案信息、工资信息、异动信息等与该教师相关,就可将这些信息数据归入教师主题之中;以此类推,科研管理系统和教务管理系统中该教师的相关信息数据也可集成过来,最终形成一个用户自定义的完整的教师主题。主题对象管理的具体功能包括:主题对象生成、主题对象权限管理、主题对象查看、主题对象展示等。

表1 区域教育大数据中心的主题库列表

(3)数据采集

数据采集是数据中心的核心业务,主要通过数据访问接口实现数据的共享传输。数据采集是实现数据集成、数据交换的前提,系统管理员可以灵活选择数据的采集源——可以是某个信息化应用系统的数据采集,也可以是某类主题的数据采集;采集的时间、数据的生命周期等也都可以灵活设置。采集到的数据应进行数据格式转换与数据清洗,检测数据中存在的错误和不一致并剔除或者改正它们,从而提高数据质量,保证全区数据的规范性、一致性。

(4)数据存储

教育大数据中心部署云存储网络,除了应用DB2、MySQL、Oracle、SQL Server等常规关系型数据库,还应充分利用CouchDB、MongoDB、Redis等非关系型数据库,以根据不同存储业务对读写速度、存储效率、访问性能、扩展性、安全性等的具体需求灵活部署、优化组合。

(5)数据同步

共享数据中心与数据源的各个应用系统数据库应保持同步更新,提供多种灵活的同步策略,如实时更新、定期更新、增量更新等。除了支持区域智慧教育综合服务平台内部各应用系统间的数据同步,还应支持与省、市、区等其它部门相关业务系统(如市人事管理系统、资产设备管理系统、学籍管理系统等)的数据同步。

(6)数据交换

教育大数据中心建设的重要价值在于数据共享,而数据交换正是实现数据共享所必不可少的技术手段。教育大数据中心通过数据采集,将不同应用系统的数据进行标准化改造,转换成符合特定教育信息化规范的数据。不同的应用系统通过到教育大数据中心提取数据,实现教育信息的共享。此外,区域教育大数据中心还应按需为其上级教育管理机构提供数据,如向省、国家教育管理信息系统提供所需的学籍信息、教职工信息等。

(7)安全管理

数据安全管理主要负责系统数据的安全保密,是系统配置与管理中的重要一环。教育大数据中心对数据的备份策略、恢复机制、加密策略、数据清理等都有很高的要求,要求管理员:①手工配置数据库备份的方式、频率,备份的位置,以及备份的技术如数据镜像复制技术、虚拟存储技术、快照技术、SAN技术等;②在平台中手动恢复数据库;③选择数据加密的方式(如MD5、RSA、IDEA、DES等),敏感数据通过密文的方式在网上传输;④加强用户密码安全管理;⑤定期进行数据冗余检查,发现冗余数据即时清理,使已经过时的陈旧数据能通过系统自动删除,以节省存储空间;⑥当系统运行出现问题时,通过查看系统自动记录的所有用户关键操作信息的日志,了解系统问题的产生原因并及时解决,保证系统平稳、安全地运行。

(8)角色与权限管理

角色与权限管理是整个系统安全运行的基础,注册用户必须分配某种角色后才能享受特定的服务。不同角色的权限分配直接影响用户享受服务的质量和水平,权限控制不当将会给系统的安全带来潜在威胁。角色与权限管理的具体功能包括:角色管理、添加角色、删除角色、修改角色、用户角色分配、角色权限关联、群组管理等。

(9)运营管理

教育数据是一笔公共资产,一方面我国应在保护隐私的情况下将其适度开放,同时借鉴美国、英国、澳大利亚等政府开展的公共数据开放运动,将区域教育数据适度开放给对教育领域数据应用感兴趣的决策人员、学者、程序员、企业和社会公民,以提高教育数据的利用率;另一方面需要强化运营管理和监控功能,实现对各种数据应用情况的实时监控,并通过管理者动态地调整数据的公开程度,建立相关的网络审批机制,以保证教育数据运营的合法性。

(10)系统设置

系统主要设置教育大数据中心与各应用系统间的更新时间、更新频率、更新方式以及数据保存期限、数据备份策略、在线最大用户数、界面风格等。

(11)教育数据挖掘

教育大数据中心将有效集成数据挖掘领域常用的数据挖掘与分析方法(如关联分析法、聚类分析法、分类分析法、异常分析法、特异群组分析法、演变分析法等),并将现有较为成熟的挖掘算法与开源工具集成到教育大数据中心平台,一方面便于对各业务系统的数据进行常规的数据挖掘,另一方面可以在此基础上构建多种更具针对性的分析模型(如课程学习成功预测模型、区域教育均衡发展趋势预测模型、学生学习障碍诊断模型、教师教学行为诊断模型等)。

(12)可视化分析与呈现

为了让教育管理者、教师、学生、家长等能够更加直观地理解教育数据挖掘和各种教育统计分析的结果,教育数据需要从“不可见”向“可视化”转变。因此,教育大数据中心平台需内嵌多种可视化算法,以便将中小学学业成就评价、学习行为分析、体质健康评价、本科教学质量评估、教育信息化与教育现代化发展评价等在内的各种教育评价与评估结果,根据需要以统计图表、时间线、知识地图、网络图、层级结构图、数据流图等多种方式灵活展现。

三平台建设与运营的关键问题分析

在全球化公共数据开放运动的大背景下,开放教育数据是大势所趋。然而,区域教育大数据中心平台的建设是一个系统化的工程,当前面临的最大挑战不是技术,而是平台的管理和运营。比如,美国的教育大数据存储机构inBloom仅仅运行了15个月便关闭,主要原因便是教育数据开放过程中导致的安全问题。基于此,区域教育大数据中心平台的可持续发展,迫切需要解决三大关键问题:

1 教育数据的适度开放

教育数据是一种公共数据,本身具有一定的社会公益性,应当向社会适度开放。教育大数据的适度公开,将汇聚广大民众、企业、政府等多方智慧,使教育数据资产实现持续增值。但由于面临隐私保护问题,因此必须配套相关的数据保护机制和措施,既保证数据的安全,又能激发数据的活力,以实现教育数据价值的最大化。

此外,对于教育数据的开放程度、开放范围、开放对象等都应进行深入的论证,以确保教育数据使用的合法性,并确保教育数据的使用有利于区域教育的创新发展,而非阻碍、破坏、甚至危及社会的安全。为此,政府部门应对教育数据加强监管,参考通信领域颁发运营商牌照的方式,制定教育数据运营商准入标准并颁发运营牌照。非官方机构想进行教育数据的研究与使用时,需按规定满足相应的条件并取得许可资格,才能获得教育数据的使用权限。

2 教育数据的全面治理

当前,我国区域教育信息化在发展过程中存在的数据问题主要包括:数据采集较为困难、数据尚未有效整合、数据质量和可用性不高、数据利用率低、数据服务单一化等。基于此,高水平的区域教育大数据治理需要各级教育机构、管理部门、相关企业以及社会民众的集体参与和有效协同,以对教育数据进行更加精细的分类和分层管理。

区域教育大数据中心平台需要提供全流程教育数据治理的各项功能支持。一般而言,教育大数据治理工作主要包括:教育数据的分类管理、教育数据的全流程管理、教育数据的质量管理与提升、教育数据的安全管理。其中,教育数据的全流程管理需要以教育数据分类所形成的数据集合为基础,构建教育数据从采集、处理、存储、分析到应用的一体化业务流程,为教育数据的质量管理和安全管理工作提供能力支撑。围绕教育数据的全面治理,可以研发各类教育大数据产品,构建一个完整的教育数据服务体系。区域教育机构通过大范围的教育产品应用和交互式服务供给,能够加强教育数据的统筹治理能力,进而推进教育政策的科学制定,逐步提升教育服务水平。

3 教育数据的创新应用

随着教育数据开放程度的不断加深,非结构化的教育数据不断增加,教育数据挖掘的原材料越来越丰富,数据的价值也越来越凸显。利用教育数据挖掘技术和学习分析技术构建教育领域相关模型,探索教育变量之间的相关关系,为教育教学决策提供有效支持,将成为未来教育的发展趋势[13]。教育数据的应用需遵循“价值最大化”的原则,充分利用数据挖掘、学习分析、BI、机器学习、可视化等技术,对纷繁复杂的教育数据进行多角度、多路径的分析(如关联分析、聚类分析、回归分析、决策树分析、神经网络分析),以充分挖掘教育数据隐藏的价值。

结合教育发展需求进行教育数据价值的深度挖掘,是区域教育大数据中心价值“落地生根”的根本途径。针对当前区域教育发展与改革所面临的均衡发展、质量提升、减负、择校等难题,广大教育研究者和实践者应转变问题的思考方式,培养数据思维,尝试应用教育大数据来予以破解。教育大数据的创新应用价值主要体现在大数据驱动教学模式的改革、大数据驱动个性化学习的真正实现、大数据驱动教育管理的科学化、大数据驱动教育评价体系重构、大数据驱动科学研究范式转型、大数据驱动教育服务更具人性化等方面。当前,全国各地应加快各种数据应用模式的积极探索,不断提炼总结若干典型、有推广价值的案例,明确教育大数据的应用思路,从而引导全国各地的教育行政机构、学校、教育培训企业等合理应用教育大数据,有效发挥教育大数据的创新应用价值。

[1]陈琳,陈耀华,张虹,等.教育信息化走向智慧教育论[J].现代教育技术,2015,(12):12-18.

[2]杨现民,余胜泉.论我国数字化教育的转型升级[J].教育研究,2014,(5):86-93.

[3]柯清超.大数据与智慧教育[J].中国教育信息化,2013,(24):8-10.

[4]张进宝,黄荣怀,张连刚.智慧教育云服务:教育信息化服务新模式[J].开放教育研究,2012,(3): 20-26.

[5]葛虹.基于云计算理念的区域“智慧教育”构建探索[J].中国教育信息化(基础教育),2012,(10):72-74.

[6]贺志强,韩政涛,贺龙祥,等.教育资源建设平台的发展与展望——从单机版资源库到校园网资源管理平台,再到区域资源共建共享平台[J].现代教育技术,2009,(4):67-72.

[7]陈琳,王矗,李凡,等.创建数字化学习资源公建众享模式研究[J].中国电化教育,2012,(1):73-77.

[8]莫淑坤,韩竞,尹飞,等.内蒙古数字化终身教育公共服务平台构建路径[J].广播电视大学学报(哲学社会科学版),2013,(3):95-101.

[9]陈琳,王矗,陈耀华,等.终身学习信息资源建设的战略意义与模式创新[J].现代远程教育研究,2012,(4):41-46.

[10]杨现民.区域智慧教育综合服务平台建设与关键问题探讨[J].现代远程教育研究,2015,(1):72-81.

[11]余胜泉,赵兴龙.基于信息生态观的区域教育信息化推进[J].中国电化教育,2009,(8):33-40.

[12]罗铮.浅析大数据时代的数据挖掘与数据资产运营[J].电子技术与软件工程,2013,(24):212-213.

[13]徐鹏,王以宁,刘艳华,等.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013,(6):11-17.

编辑:小米

The Construction of Big Data Center Platform for Regional Education

XU Chao-chao CHEN Shi-chao ZHAO Xin-shuo YANG Xian-min

Smart education is leading a new round of development and reform wave for regional education informatization, while big data is the basis to realize the “smart” upgrading of regional education system. Based on the value orientation of big data center platform in regional education, this paper focused on the architecture design of big data center platform. In addition, this paper discussed three key issues existing in the construction and operation of this platform that included appropriate opening of education data, comprehensive management of education data and innovative application of education data, expecting to provide guidance and reference for the construction and development of big data center platform in various regions.

smart education; educational big data center; regional educational informatization; platform construction

G40-057

A

1009—8097(2016)11—0005—08

10.3969/j.issn.1009-8097.2016.11.001

本文受国家级大学生创新训练计划项目“开放知识社区用户编辑行为分析与支持能力提升研究”(项目编号:201510320059)、江苏高校优势学科建设工程资助项目“江苏师范大学教育学省优势学科建设”(项目编号:苏政办发[2014]37)资助。

徐超超,研究方向为智慧教育、开放知识社区,邮箱为tiantiandexuanlu@qq.com。

2016年8月30日

猜你喜欢
数据中心智慧区域
酒泉云计算大数据中心
浅析数据中心空调节能发展趋势
分割区域
关于建立“格萨尔文献数据中心”的初步构想
区域发展篇
基于云计算的交通运输数据中心实现与应用
有智慧的羊
智慧派
区域
智慧决定成败