数据科学与大数据技术专业实践教学体系研究

2021-12-17 15:24魏凌华徐成振胡国亮
关键词:软件科学体系

魏凌华,徐成振,胡国亮

(淮北师范大学 计算机科学与技术学院,安徽 淮北 235000)

0 引言

相对传统数据,大数据有容量大、类型多、存取速度快和应用价值高等特征[1].使用新方法对大数据进行采集、存储和分析,可以从中发现新的知识点和创造新的应用价值[2].对大数据处理和应用的过程中,人们的生活方式和社会的发展也有着翻天覆地的变化.为尽快适应大数据的发展趋势[3-4],2015年国务院印发《促进大数据发展行动纲要》,其中重点提出大数据技术人才培养的问题[5-8],作为培养人才的基地,数据科学与大数据技术专业在高校中迅速展开.

专业的开设仅仅是开始,如何建设好数据科学与大数据技术专业才是重点,尤其是大数据专业实践教学体系的建设更是重中之重[9-12].当前教学模式经历灌输式、启发式、体验式3个过程,而数据科学与大数据技术作为实践和应用性很强的专业,也经历这3个过程.该专业不仅需要丰富的理论知识,还需要具备更强的实践操作能力,而达到这些要求仅仅靠理论教学是远远不够的,还需要实践教学的支持才能达到专业人才的标准.要提高实践教学的标准,目的是增强学生动手能力.重视实践教学环节,是对大数据专业的必然要求;完善实践教学体系,是培养大数据应用型专业人才的基本要求.因此,为办好数据科学与大数据技术专业,需要高校教师能够掌握大数据专业的特点和大数据人才的培养规律.

1 数据科学与大数据技术专业课程体系分析

数据科学与大数据专业作为一门新兴学科,它以计算机和数学等为基础,以生物科学、医学、管理和经济等学科应用为拓展,以分析数据和挖掘其中的价值为目标[13].所以该专业对人才的专业技能要求较高,既要有计算机专业的知识,又要有较强的统计分析能力,同时还需要掌握不同应用场景的相关背景知识[14].

数据科学与大数据专业由基础课程、专业核心课程和实践课程3大模块组成[15-16],其中实践课程是大数据整个教学体系中的重点,它不仅是对理论课程的有益补充,还是培养学生动手能力的重要环节.现有流行的大数据技术以Hadoop为主,且形成以Hadoop为基础的生态圈[17-18],如图1所示.

图1 Hadoop生态系统

由图1中可以看出,Hadoop生态系统不仅涉及的框架多,而且软件前后关联性较强.大数据的基本处理流程主要包括:数据采集、存储管理、处理分析、结果呈现等环节.其中大数据技术的层面、功能和涉及的软件如表1和表2所示.

表1 大数据技术的不同层面和功能

表2 大数据技术涉及的软件

从大数据涉及的软件、框架和数据分析流程可以看出,数据科学与大数据技术专业课程在建设的过程中,不仅要夯实学生的理论基础,而且要提高学生解决实际问题的能力.

2 实践课程特点

数据科学与大数据技术专业强调培养具有编程技术、数据统计和分析能力的复合型人才.在传统的教学观念中,实践教学附属于理论教学,是理论教学的辅助.但实际上该专业不仅需要丰富的理论知识,还需要具备更强的实践操作能力.因此,如何建设好实践教学体系已经成为数据科学与大数据专业研究的热点问题之一.目前我国高校教学基本模式是:大一和大二学习基础课程;大三学习专业课程;大四进行实习.结果是实践环节占总学时比例过低,造成学生动手能力严重不足.

高校增设大数据专业之后,在实践教学体系的建设上同样面临着很多问题.大数据的实践课程主要分为2大类,第一类是理论课程的附属实践课程;第二类是独立的实践课程.形式上和其他专业并无太大区别,但从图1中可以看出,大数据专业的实践课程特点是涉及的软件数量多、体系复杂、不同软件的关联性强.数据科学与大数据专业的实践课程有别于传统专业的实践课程,主要有以下2个方面.

首先,数据科学与大数据专业实验课程涉及的软件数量多.数据科学与大数据专业实验课程内容和工作量有别于传统专业的实验课程,传统专业的教学方式已经不适应数据科学与大数据技术专业的课程,特别是对该专业的实践课程.数据科学与大数据技术专业涉及的软件有:Hadoop、HDFS、HBase、NoSQL、MapReduce、Hive、Spark、可视化工具(Easely.ly、D3、Tableau、ECharts等)和数据采集工具(Flume、Kafka、Sqoop等).相比传统专业课程的实验,数据科学与大数据技术专业的实验涉及的软件多、实验内容工作量大.

其次,数据科学与大数据专业课程的先后关联性强.传统专业的实验课程基本上是理论课程的补充和实践,通过对该课程的学习和实践就能够掌握相应的知识.而数据科学与大数据的实验课程比较复杂,除掌握本课程的知识点,还需要掌握相关联课程的知识点.例如大数据专业所有的软件搭建都在Linux操作系统上(包括debian系、redhat系和其他自由发布的版本),这就需要学生掌握Linux的基本命令,否则无法实现所学课程软件的安装和维护.在大数据专业中,MapReduce是一种并行编程模型,而在编程时需要用到Java,因此学生还要提前掌握Java的知识.其中关联如图2所示.

图2 大数据课程及软件的先后关联图

从图2可以看出以下3点:

(1)Linux和Windows操作系统是大数据专业课程和软件的基础;

(2)除Tableau只有Windows版本,其他软件都支持Linux;

(3)其中Java、R、Spark、Linux均为独立课程,其他软件可以单独成为一门课程,也可以综合为一门课程.

3 实践课程体系的构建

数据科学与大数据专业实践教学是教学系统中的重中之重.数据科学与大数据专业作为一个新兴专业,有其他专业的实践教学经验可借鉴,但又因为专业自身的特点,决定着该专业必须有适合自身的教学特色.

数据科学与大数据技术专业实践教学系统是大数据教学中非常重要的环节,不仅能够提高学生对理论知识的理解,而且还能提高学生的实际动手能力,有益于学生综合素质的发展.

但在实际的教学中,数据科学与大数据技术专业的实践教学存在以下问题:

(1)实验内容单一,相对独立,不能构成体系.不论是理论课程附带的实验,还是专业实训,实验内容前后缺乏关联,不能有效形成完整的体系.

(2)实践教材不完善.由于是新开设的专业,存在教材不足的问题.数据科学与大数据技术是以计算机和数学为基础发展起来的综合学科,但由于计算机和数学已经形成复杂的学科系统,如何从这些学科中选择合适的内容,平衡其中的深度和广度问题还有没有明确的参考标准.

(3)考核机制不健全.当前大部分高校对学生参加大学生创新创业以及各类竞赛,给予高度认可,但基本都是物质奖励和荣誉奖励,缺乏整体的考核机制.对于参赛的指导教师和学生而言,由于参赛影响平时的工作和学习,因此造成师生的参赛动力不足,也从客观上降低学生的动手和创新的积极性.

基于当前环境和以上面临的问题,对于数据科学和大数据专业实践教学体系的构建,主要从实践课程特点、实践教学内容的关联性和考核评价机制3个方面进行研究.

(1)分层次实践教学,提高学生的综合实践素质.实验是理论课程的加深和强化,通过对实验的操作,可以提高学生对理论知识的理解和解决实际的能力,是整个实践教学体系的基础.在构建数据科学与大数据技术专业实践教学体系时,实践教学可以分为3个层次.课程附属实验是第1层次,是对理论课程知识的加深和强化.专业实训是第2层次,是一种以实训为主、理论为辅的阶段性综合实训,通过对项目的完成,可以检验学生对所学知识掌握的程度和提高学生的实际应用能力.企业实践是为让学生提前了解企业的实际需求,为学生提前进入社会打下基础.

(2)分阶段实践教学,提高实践内容的前后关联性.学生能力培养过程是由不同阶段构成的,每个阶段都是由一系列的理论和实践教学活动来形成,而且不同阶段的教学内容应前后关联.加强不同课程教学内容的衔接,顺利完成大数据的不同实践课程知识点的过度.数据科学与大数据专业的课程涉及的软件和知识点较多,因此在实践课程安排时,不仅要照顾到本课程的实验内容,还要增加为完成实验所需其他课程的知识,如图2所示.例如在Hadoop课程中,实践课程中首先是安装hadoop 2.7版本的软件,在Linux操作系统下创建hadoop用户、更新APT、安装SSH和安装Java环境,其中需要学生提前掌握useradd、tar、update等Linux命令.如果学生不具备相应的知识,实验课程的后续内容则无法完成.

(3)完善实践教学的考核评价机制.合理的考核评价机制,可以确保实践教学的效果和持久发展.通过参加大数据专业创新创业和学科竞赛,学生不仅可以提高对所学知识的理解,而且还可以培养大学生的团队合作精神和创新能力.把创新创业、学科竞赛、平台训练等引入到实践教学内容中,对原有教学体系进行调整和完善.增加学生获得学分的途径,可以激发学生创新的意识.

合理的考核评价机制提高教师的教学主动性,激发学生的学习意识,从根本上解决教师不愿指导学生和学生不愿参加竞赛的现状,确保实践课程的教学效果和良性发展.

4 结论

大数据人才的培养不可能一蹴而就,它是一个循序渐进、逐步加深的过程.重视实践教学环节,是提高大数据专业人才水平的必然要求;完善实践教学体系,是培养大数据应用型专业人才的基本要求.大数据实践教学体系应该分层次和分阶段来完成相应的目标任务.构建基于大数据实验实训平台的生态系统,满足课程实验和专业实训的需求,从学生的实际情况和企业的需求着眼,探索适合数据科学与大数据专业实践课程的教学模式.数据科学与大数据技术专业实践教学体系的构建还有很多问题有待解决,未来数据科学与大数据技术专业的人才应该是懂理论、能动手且能融合到不同应用场景中的复合型人才,因此在构建数据科学与大数据技术专业实践教学体系时应以培养符合社会需求的人才为核心,以提高学生解决实际问题的能力为目标,提高该专业的实践教学质量.

猜你喜欢
软件科学体系
禅宗软件
构建体系,举一反三
点击科学
科学大爆炸
软件对对碰
即时通讯软件WhatsApp
科学拔牙
“曲线运动”知识体系和方法指导
“三位一体”德育教育体系评说
丰富多彩的Android软件