基于PTA量表的大学生科学探究能力评价研究
——以南京地区高校为例

2021-11-27 07:12顾乃景
考试研究 2021年6期
关键词:纸笔要素测试

顾乃景 伏 干

一、问题的提出

21世纪是强调科技创新的时代,国家间综合国力的竞争日益体现在科学技术实力的竞争上,而科学技术的进步离不开具有较高科学素养和科学探究能力的人才。科学探究能力是科学教育的核心理念已成为共识,它是学生科学素养发展的内在思维品质,既是科学思维及批判质疑态度发展的内化结果,又是将二者有机结合灵活运用以解决问题的重要保证[1]。大学生,特别是本科生群体,作为未来科学教育乃至整个国家、社会发展的中流砥柱,其科学探究能力水平将直接影响《中国教育现代化2035》提出的“推动我国成为学习大国、人力资源强国和人才强国”目标的实现,并决定未来科学教育事业以及国家、社会的进步发展水平。国内外对“学生科学探究能力”这一主题的研究,多集中于“对科学探究能力的研究”及“对科学探究能力培养的研究”两方面,有关“科学探究能力评价”的研究相对较少,且评价研究多集中在中小学阶段,大学阶段的研究相对较少。本研究将基于PTA量表,结合相关评价方式,对大学生的科学探究能力进行实证研究,从而为促进大学本科生科学探究能力的提升和发展做出探索。

二、研究方法

(一)评价体系

1.评价体系确定的依据

科学探究能力必须外显为具体的、可测量的行为,才能进行有效地评价。为此,在对大学生的科学探究能力评价过程中,选择恰当的评价依据十分重要。美国安迪生和沃尔佛德设计出的“基本要素分析法”(Primary Trait Analysis,PTA)将需要评价的表现,层层细分为外在可测量的基本要素,逐一评价,取得了良好的效果[2],在国内外理工文医多门学科的教育领域得到了广泛应用,如Varela Manuel F等采用PTA量表评价免疫学硕士“分析科学文献”的能力[3],盛刚采用PTA量表评估高中生历史学科“史料实证”能力[4],蓝岚采用PTA量表进行“凸透镜成像规律”相关物理教学等[5]。其基本假设是:无论是行为表现,还是认知表现,都是由一系列基本要素组成的,这些要素是学生学习知识、获得技能的基本单元;通过对这些基本单元的行为表现进行评定,就可以从整体上对学生的表现进行适当评价。基本步骤见表1[6]。

表1 PTA量表建立的基本步骤

评价目标、评价标准以及评价方式、方法是科学探究能力评价中的核心问题,具体而言,相关评价目标、评价标准回答了科学探究能力该“评价什么”的问题,而评价方式、方法回答了“怎么评价”的问题。由表1可见,PTA量表的建立准确解决了“评价什么”和“怎么评价”的问题。使用PTA量表,宏观上可以看出学生科学探究能力发展的整体情况,微观上又可以了解学生各个能力要素发展的具体情况,从而为评价者及学生提供全面有效的反馈信息,以便采取相关针对性措施,提升学生的探究能力水平。目前,由于其科学的理论基础和实践研究,PTA量表被广泛用于开放性试题开发等方面。

2.评价体系的确定

系统的、现代的科学教育多源于国外,其科学探究能力评价的成功经验值得借鉴学习。相关的评价主要有国际学生评价项目(Program for International Student Assessment,PISA)、国际数学和科学评测趋势项目(Trends in International Mathematics and Science Study,TIMSS),英国的“教育与科学部成就评估”(Assessment of Performance Unit,APU),美国的“探究的原则性评价设计方案”(Principled Assessment Designs for Inquiry,PADI)、国家教育进展评估(National Assessment of Educational Progress,NAEP)等等[7]。上述评价都提及了科学探究领域的实践内容。例如,英国的APU将科学探究能力要素分为6个方面,包括符号表征的使用、器材及测量工具的使用、观察能力、解释及应用、探究设计、整体探究表现,并将其划分为若干个小的方面;PISA 2015提出了3种能力要素,包括科学地解释现象、评价和设计科学探究、科学地解释数据和证据,在具体能力要素下也有若干小的方面;TIMSS 2015提出了5个有关科学实践的方法,包括对问题和猜想进行建模、设计调查或研究方案、重组和表示数据、分析和解释数据、得出结论和进行解释。在我国,化学、生物、物理等课程标准中均将科学探究作为学科核心素养重点提出。《普通高中物理课程标准(2017年版)》中将科学探究要素分为四项,主要包含问题、证据、解释、交流这四大要素[8]。《普通高中物理课程标准(实验)》中对科学探究的要素归纳更为具体,包含7项:提出问题、猜想与假设、制订计划与设计实验、进行实验与收集证据、分析与论证、评估、交流与合作[9]。由具体的评价内容来看,上述评价及课程标准共同涉及了以下的步骤[10]:(1)提出问题,即从对自然世界的现象观察中产生问题,形成可验证的科学假设;(2)收集证据,即设计可施行、可控制的实验来收集证据,以支持或者推翻原有假设,在此过程中需要将对科学概念的理解与可观察、可测量的实验联系起来,形成测量的具体步骤(在很多体系中,证据的收集并不局限于控制性的实验方法,还可以包括问卷、访谈等诸多方法,而本研究由于测评需要,针对大学生的收集证据方法只重点考察实验法);(3)处理数据,即根据变量类型,描述或验证数据的模式,从而探索数据之间的关系;(4)回答问题,即使用观察结果和调查证据来回答问题,支持或推翻假设;(5)反思讨论,即与他人合作,使用科学知识及相关调查结果来支持结论的逻辑性,并将所得结论应用到新情境中。

本研究结合上述5个步骤,并为突显“为评价提供明确的参考标准,将科学探究能力由抽象变得具体”的要求,依据PTA量表建立的基本步骤,明确测量的目标、标准及方式[11]。

(1)确定评价目标。科学探究能力要素是隐变量,不能直接对其进行评价,所以要将这些因素外显为学生的行为特征,也就是将其表现为显变量,才能完成评价[12]。为了更好地对学生进行评价,将上述5个步骤细化为多个具体可测量的要素,如“提出问题”“猜想与假设”等。

(2)建立评价标准。本次实验采用德尔菲法(专家调查法),即通过匿名反复函询的方式进行,各位专家可以自由发表意见,这种方法能够集思广益,取各家之长,避各家之短,使最终获得的结果可靠性较高[13]。本研究将相关评价内容以电子邮件的方式发送给物理教学、科学教育等领域的共计7名专家并参照相关学者研究[14],进行征询调查,总计两轮:第一轮主要征询拟定的能力要素指数是否合理,第二轮针对量表指数确定后的意见反馈,确定了本次科学探究能力评价中各要素的权重指数,最终将学生科学探究能力的总分定义为:M=∑miαi,其中,mi表示相应能力要素的得分,αi表示第i项能力要素的指数(注:为了便于计算,本评价标注指数总和以2.8为基数),见表2。

表2 科学探究能力各要素PTA量表

续表2

续表2

(二)研究对象

本研究的目的是对大学本科生科学探究能力进行评价,由于人力、物力以及相关条件的限制,选择了某985院校及某普通院校学生,涉及不同专业、不同户籍等,所有学生均参与工作单及纸笔测试。在去除残卷、白卷、无名卷及不对应卷(即仅仅参加工作单或纸笔测试中的一个)后,整体有效答卷115份,满足了研究的需要。被试详细信息如表3所示。

表3 被试详细信息

(三)研究工具[15-17]

1.工作单设计

工作单1:提供相关情境,引出问题。提供具体情境,让学生自己发现并提出相关探究问题,并将问题写在工作单上。工作单1主要考察学生提出问题的能力。

工作单2:猜想并提出假设;设计实验方案。工作单2呈现工作单1中需要探究的问题,给学生一定的时间,让他们针对问题进行猜想,提出相关的假设,并使用相关器材设计可以探究的方案。工作单2主要考察学生猜想与假设的能力以及实验方案设计能力。

工作单3:学生根据自己的假设与方案设计,进行相关实验操作;分析实验结果,得出结论,并说明原因;分析误差,列出至少三个影响结果的原因;反思自己的实验设计,写出相关实验改进的建议。工作单3主要考察学生实验操作和观察、控制变量能力、运用数学工具能力、评价与反思能力、下结论能力。

基于“实验可操作性”的原因,工作单主要借鉴曹永青“单摆的周期影响因素”设计,整个测试时长为50分钟,其中工作单1时长5分钟,工作单2时长15分钟,工作单3时长30分钟,结合科学探究能力各要素PTA量表,工作单总分为14分(不含加分)。

2.纸笔测试卷设计

纸笔测试分为两部分:第一部分是被试学生的基本信息,包括学生的性别、所属学校、高中分科、本科专业及户籍等信息;第二部分是测试题的具体内容。在本次研究中,对纸笔测试进行了可靠性检验,分半信度为0.72,表明内在一致性较好,纸笔测试题的可靠性较高。整个测试时长为90分钟,结合科学探究能力各要素PTA量表,纸笔测试总分为14分(不含加分)。

三、研究结果

(一)总体情况

1.整体分析

通过对工作单、纸笔测试总得分数据进行正态检验,得知两种评价方式下总分均呈正态分布。相关描述统计见表4。

表4 大学生科学探究能力水平总分描述统计

表5则呈现了两种评价方式平均分比较。

表5 两种评价方式平均分比较

总体而言,学生在工作单的得分区域分布要优于纸笔测试,其原因如下:

(1)从测试内容和难度方面来看,纸笔测试涉及的问题情境(知识点范围)比较多,试题之间的联系较少,整体上难度较大。而工作单围绕“单摆”这一个情境进行,并且采用有一定提示的工作单评价方式,难度与纸笔测试相比较小。

(2)从学生本身来看,学生先前较少接触工作单这种形式,对它比较感兴趣,重视程度较高;而对纸笔测试这种能力测评形式的重视程度较低。此外,纸笔测试集中在晚自习期间进行,学生在忙碌了一天之后,可能比较劳累,并非所有学生都很积极地参与测试。

对两种方式总分进行相关性分析,在置信度为0.01时,两种方式总分显著相关(0.433)。

2.各要素分析

本次分析需对工作单、纸笔测试分数据进行正态检验。正态检验中的非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro-Wilk(W检验)。SAS中规定:当样本含量n≤2000时,结果以Shapiro-Wilk(W 检验)为准,当样本含量n>2000时,结果以Kolmogorov-Smirnov(D检验)为准。本次样本量为115,故以W检验为准。对工作单和纸笔测试两种评价方式下的各能力要素得分进行正态检验,各要素sig.值均小于0.05,两种方式下各能力要素均不呈现正态分布。

在数据不服从正态分布时,U检验比T检验统计效能更高,从控制一类错误的角度讲,如果U检验一类错误能控制到0.05以下,采用U检验更优。因此使用Mann-Whitney U检验来检验两种方式下各能力要素是否存在差异,见表6。

表6 一级指标(各要素)得分率

由表6可知:在提出问题、推理和预测以及下结论三个能力要素方面,两种方式得分差异不显著,而其他五个能力要素差异显著。具体如下:

(1)工作单方式下,大学生的科学探究能力各要素得分较为理想,各要素的均分均高于2.5分(单要素赋值为5分)。其中,评价与反思能力得分最高,为4.39分。取得分中值作为中等水平参考值,通过比较发现,实验操作、控制变量以及推理和预测、评价与反思三个能力得分稍低于参考值,其他5个要素得分均高于参考值,可见学生在工作单方式下,科学探究能力水平整体处于中等水平。

(2)纸笔测试方式下,大学生的科学探究能力各要素得分不平衡。其中实验操作、控制变量,运用数学工具,推理和预测以及评价与反思能力四项得分均低于2.5分。此外,取得分中值作为中等水平参考值,通过比较发现,除了推理和预测、运用数学工具两个能力要素,得分与参考值差距较大,其他6个要素得分均略高于或略低于参考值,可见学生在纸笔测试方式下,反映出来的探究能力整体水平不高,处于中等水平。

为了研究探究各能力要素之间以及与总分是否存在某种依存关系,采用相关性分析分别对工作单和纸笔测试两种评价方式进行内部相关性的检验。在相关性分析中,数值代表Person相关性系数,它用来衡量定距变量之间的性关系,越接近于1相关性越强,反之越弱。具体见表7和表8。

表7 大学生科学探究能力各要素(工作单)相关性

表8 大学生科学探究能力各要素(纸笔测试)相关性

由表7可知,在工作单方式下,各能力要素与总分之间高度相关;评价与反思与其他7个能力要素之间缺乏相关性,可能是因为学生平时在这方面的训练较少,不太重视对评价过程及结果的总结。除此之外的各能力要素之间显著相关。

由表8可知,在纸笔测试方式下,各能力要素也与总分之间高度相关。从各能力要素之间看:运用数学工具、猜想与假设两个能力之间没有相关,这可能是因为运用数学工具这一能力,在纸笔测试下,更强调学生数据的选择和统计方法的使用,着重考查学生的数理使用能力,而且没有具体的实验情境,导致了两个能力之间的不相关。下结论和提出问题、猜想与假设两个能力之间没有相关,这可能是因为下结论主要是依据实验材料,如根据实验数据的分析结果提出相关结论,即更强调从实证证据来得出相关结论,而与提出问题、猜想与假设等关系不大。类似于工作单,评价与反思与其他7个能力要素之间也没有相关性。除此之外的各能力要素之间显著相关。

由此可见,各能力要素之间以及与总分之间显著相关,说明在工作单和纸笔测试两种方式下,这些要素都是科学探究能力的主要素。通过这些要素的分析,可以了解大学生的科学探究能力水平发展情况。

(二)不同学校

1.整体分析

在工作单及纸笔测试两种方式下,大学生的总分都呈正态分布,采用独立样本T检验进行处理,探索校际在评价总分是否存在差异,见表9。

表9 大学生科学探究能力平均数及差异检验(校际*能力)

如表9所示,在工作单和纸笔测试两种评价方式下,校际对大学生探究能力总分造成显著差异。由总分可见,在两种评价方式下,重点院校学生科学探究能力水平要优于普通院校学生。

2.各要素分析

工作单和纸笔测试两种评价方式下的各能力要素得分均不呈现正态分布。使用Mann-Whitney U检验来检验校际下各能力要素是否存在差异,见表10。

表10 大学生各科学探究能力要素得分情况(校际*能力)

从表10中的数据来看:在工作单形式下,两校大学生在八个要素均差异显著。在纸笔测试下,两校大学生在猜想与假设,实验方案设计,实验操作、控制变量,推理和预测能力四个要素差异显著,而其他能力要素,就本次调查的数据来看,没有达到显著性。

纵向观察表10可以发现:(1)工作单方式下,在实验操作、控制变量能力这个要素上,重点院校学生得分低于普通院校学生得分,而其他7个要素均高于普通院校学生。纸笔测试重点院校学生在8个能力要素上均高于普通院校的学生。(2)在工作单方式下,最低分上面,重点院校实验操作、控制变量能力2.88分,普通院校推理和预测能力1.90分;最高分上面,重点院校下结论能力4.67分,普通院校评价与反思能力4.25分;从整体上看,普通院校学生除了在推理和预测能力上得分1.90,低于2.5分,两校学生在其他能力要素上均高于2.5分。可见两校学生在工作单方式下各个要素得分均较高,处于中等偏上水平。(3)在纸笔测试方式下,两校学生的最低分也都出现在评价与反思能力上面,重点院校1.23分,普通院校1.14分。最高分上面,重点院校实验方案设计能力3.97分,普通院校提出问题能力3.32分;从整体上看,提出问题能力、猜想与假设能力、实验方案设计能力以及下结论能力四个方面两校得分均超过2.5分。在其他四个能力要素中,除了重点院校学生在推理和预测能力上的得分超过3分,其他均低于2.5分。可见两校学生在纸笔测试方式下各个要素发展均不平衡。

横向观察表10可以发现:整体上,除普通院校学生在提出问题能力、推理和预测能力、下结论能力三个方面,工作单低于纸笔测试得分,两校学生在其他要素上,工作单方式下的得分高于纸笔测试得分。在一些要素上差距还比较大,如评价与反思能力这一要素,工作单两校学生均高于4分,而在纸笔测试下均低于1.5分。这也说明,对于学生的探究能力评价不能仅从一种方式来评价,要综合选择多种方式,合理评价。

(三)不同性别

1.整体分析

在工作单及纸笔测试两种方式下,大学生的总分都呈正态分布,采用独立样本T检验进行处理,探索性别在评价总分是否存在差异,见表11。

表11 大学生科学探究能力平均数及差异检验(性别*能力)

如表11所示,在工作单评价方式下,性别对大学生探究能力总分未造成显著差异。在纸笔测试方式下,女生科学探究能力的实际情况优于男生。

许多有关学生能力方面的研究表明,性别因素对学生的科学探究能力存在影响。但从本次工作单和纸笔测试两种评价方式的结果来看:工作单方式下,男女之间的科学探究能力水平差异不显著;而纸笔测试方式下,两者差异显著。原因可能如下:男女学生先前都未接触过工作单这种评价方式,因此男女学生表现出来的科学探究能力水平相差不大。而纸笔测试,由于长期以来我国的考试模式以纸笔考试为主,相较于男生来说,女生有耐性、喜欢思考,答题细致、考虑较为全面,更加适应纸笔测试这种模式,因此得分较高。

在本研究中,为了进一步了解不同学校、不同性别学生的探究能力水平。笔者以性别为自变量,校际为控制变量,科学探究能力水平为因变量对大学生这一群体的情况进行分析。见表12及图1。

图1 两种方式在“性别、校际”下的直方图

表12 大学生科学探究能力(性别*校际*能力)

一般认为,在理科(科学)学习方面,尤其涉及科学探究能力水平方面,男生优于女生。但从本次所得数据来看,情况并非如此。

(1)性别:在两种评价方式下,女生的得分均比同校男生高。具体而言,重点院校男生得分低于女生,普通院校男生得分同样低于女生。

(2)学校:在工作单方面,重点院校学生得分总体高于普通院校学生。其中重点院校女生得分最高,为11.52分,随后依次为重点院校男生的11.15分、普通院校女生的9.19分,以及普通院校男生的8.92分。在纸笔测试方面,也呈现类似于工作单的情况。分析原因:由于我国大学招生以高考分数为主要录取标准,学生通过层层选拔进入高校,并且当前我国高考模式较适合于女生,这就造成了重点院校学生能力整体强于普通院校学生,女生整体强于男生现象的出现。

2.各要素分析

工作单和纸笔测试两种评价方式下的各能力要素得分均不呈现正态分布。使用Mann-Whitney U检验来检验性别下各能力要素是否存在差异,见表13。

从表13中的数据看:在工作单方式下,依本次调查所得数据来看,男女大学生在各能力要素上的差异均没有达到显著性。在纸笔测试方式下,猜想与假设、推理和预测、运用数学工具、下结论四个能力方面,显著性分别为0.006、0.041、0.027和0.001,男女学生差异显著;而其余能力要素男女之间的差异没有达到显著性。

纵向观察表13可以发现:(1)工作单方式下,在提出问题能力,猜想与假设能力,实验操作、控制变量能力这三个要素上,男学生得分高于女学生得分,其他5个要素均低于女学生,其中,男、女在推理和预测能力上差距最大,女生比男生高0.34分。纸笔测试下,在提出问题能力,评价与反思能力这两个要素上,男学生得分高于女学生得分,其他6个要素均低于女学生,六个要素男生与女生分数相差均在0.3分以上。(2)在工作单方式下,最低分上面,男女均出现在推理和预测能力这个要素上,分别为2.43分和2.77分;最高分上面,男女均出现在评价与反思能力这个要素上,分别为4.33分和4.44分;从整体上看,男女学生在8个能力要素上均高于2.5分。可见两校学生在工作单方式下各个要素得分均较高,处于中等偏上水平。(3)在纸笔测试方式下,男女学生的最低分出现在评价与反思能力上面,男生1.26分,女生1.10分。最高分上面,男生提出问题能力3.45分,女生实验方案设计能力3.44分;从整体上看,类似于工作单的情况,提出问题能力、猜想与假设能力、实验方案设计能力以及下结论能力四个方面两校得分均超过2.5分。在其他四个能力要素中,也类似于工作单的情况,除了女学生在推理和预测能力上的得分超过2.5分,其他均低于2.5分。可见两校学生在纸笔测试方式下各个要素发展不平衡。

横向观察表13可以发现:整体上,提出问题能力方面,男女学生工作单得分低于纸笔测试得分;而在其他7个要素上,工作单方式下的得分均高于纸笔测试下得分。

表13 大学生各科学探究能力要素得分情况(性别*能力)

(四)不同高中分科

1.整体分析

在工作单及纸笔测试两种方式下,大学生的总分都呈正态分布,采用独立样本T检验进行处理,探索高中文理分科在评价总分是否存在差异,见表14。

表14 大学生科学探究能力平均数及差异检验(高中分科*能力)

如表14所示,在工作单和纸笔测试两种评价方式下,高中分科对大学生探究能力总分造成显著差异。在两种评价方式下,理科学生科学探究能力水平要优于文科学生。

2.各要素分析

工作单和纸笔测试两种评价方式下的各能力要素得分均不呈现正态分布。使用Mann-Whitney U检验来检验高中分科下各能力要素是否存在差异,见表15。

从表15看:在工作单方式下,依本次调查所得数据来看,猜想与假设,推理和预测,运用数学工具,下结论四个能力方面,显著性分别为0.000、0.035、0.000和0.001,文、理学生差异显著;而其余能力要素文、理学生之间没有达到显著性。在纸笔测试方式下,猜想与假设、实验方案设计、实验操作、控制变量,推理和预测四个能力方面,显著性分别为0.000、0.002、0.001和0.003,文、理学生差异显著;而其余能力要素文、理学生之间没有达到显著性。

纵向观察表15可以发现:(1)工作单方式下,实验操作、控制变量能力这个要素上,文科学生得分稍高于理科学生,而其他7个要素均低于理科学生。纸笔测试方式下,下结论能力这个要素上,文科学生得分稍高于理科学生,其他7个要素均低于理科学生。(2)在工作单方式下,最低分上面,文科运用数学工具能力2.21分,理科推理和预测能力2.93分;最高分上面,文、理学生均是评价与反思能力,文科4.33分,理科4.43分;从整体上看,除了文科学生在推理和预测能力2.17分,运用数学工具能力2.21分,两项低于2.5分,学生在其他能力要素上均高于2.5分。可见文、理学生在工作单方式下各个要素得分均较高,处于中等偏上水平。(3)在纸笔测试方式下,文理两科学生的最低分都出现在评价与反思能力上面,文科1.13分,理科1.22分。最高分上面,文、理均在提出问题能力上,文科3.27分,理科3.49分;从整体上看,提出问题能力、猜想与假设能力、实验方案设计能力以及下结论能力四个方面两校学生得分均超过2.5分。在其他4个能力要素中,除了理科学生在推理和预测能力上的得分超过2.5分,其他均低于2.5分。可见文理学生在纸笔测试方式下各个要素发展不平衡。

横向观察表15可以发现:整体上,除文科学生在提出问题能力方面,以及理科生在推理与预测方面,文科生在下结论能力方面,工作单低于纸笔测试得分,文、理学生在其他要素上,工作单方式下的得分均高于纸笔测试得分;在一些要素上差距还比较大,如评价与反思能力这一要素上,工作单文、理学生均高于4分,而在纸笔测试下均低于1.5分。这同样说明对于学生的探究能力评价,不能仅从一种方式来评价,要综合选择多种方式,合理评价。

(五)不同专业

1.整体分析

在工作单及纸笔测试两种方式下,大学生的总分都呈正态分布,采用独立样本T检验进行处理,探索大学不同专业在评价总分方面是否存在差异,见表16。

表16 大学生科学探究能力平均数及差异检验(专业*能力)

如表16所示,在工作单和纸笔测试两种评价方式下,大学专业对大学生探究能力总分造成显著差异。在两种评价方式下,工科专业学生科学探究能力水平要优于文科专业学生。

2.各要素分析

工作单和纸笔测试两种评价方式下的各能力要素得分均不呈现正态分布。使用Mann-Whitney U检验来检验大学不同专业下各能力要素是否存在差异,见表17。

表17 大学生各科学探究能力要素得分情况(专业*能力)

从表17中的数据看:在工作单方式下,依本次调查所得数据来看,提出问题,猜想与假设,实验方案设计,推理和预测,运用数学工具,下结论6个能力方面,文、工学生差异显著;而其余能力要素文、工学生之间没有达到显著性。在纸笔测试方式下,猜想与假设,实验方案设计,实验操作、控制变量,推理和预测4个能力方面,文、工学生差异显著;而其余能力要素文、工学生之间的差异没有达到显著性。

纵向观察表17可以发现:(1)工作单方式下,类似于文、理科学生,实验操作、控制变量能力这个要素上,文科学生得分稍高于工科学生得分,其他7个要素均低于工科学生。纸笔测试方式下,文科学生8个要素得分均低于理科学生。(2)在工作单方式下,最低分上面,文科推理和预测能力2.20分,工科实验操作、控制变量能力2.90分;最高分上面,文、工科学生均是评价与反思能力,文科4.31分,理科4.61分;从整体上看,除了文科学生在推理和预测能力2.20分,运用数学工具能力2.42分,两项低于2.5分,学生在其他能力要素上均高于2.5分,这一点与文、理科学生情况极其相似。可见文、工两科学生在工作单方式下各个要素得分均较高,处于中等偏上水平。(3)在纸笔测试方式下,文工两科学生的最低分都出现在评价与反思能力上面,文科1.17分,工科1.19分。最高分上面,文科在提出问题能力上,3.33分;工科在实验方案设计,3.95分;从整体上看,提出问题能力、猜想与假设能力、实验方案设计能力以及下结论能力四个方面文、工两科学生得分均超过2.5分。在其他4个能力要素中,除了工科学生在推理和预测能力上的得分超过2.5分,其他均低于2.5分。可见文、工两科学生在纸笔测试方式下各个要素发展不平衡。

横向观察表17可以发现:整体上,文科学生在提出问题能力方面,工作单得分低于纸笔测试得分。文、工学生在其他要素上,工作单方式下的得分均高于纸笔测试得分。在一些要素上差距还比较大,如评价与反思能力这一要素上,工作单文、工两科学生均高于4分,而在纸笔测试下均低于1.5分。再次说明对于学生的探究能力评价,不能仅从一种方式来评价,要综合选择多种方式,合理评价。

(六)不同户籍

1.整体分析

在工作单及纸笔测试两种方式下,大学生的总分都呈正态分布,采用独立样本T检验进行处理,探索不同户籍在评价总分方面是否存在差异,见表18。

表18 大学生科学探究能力平均数及差异检验(户籍*能力)

如表18所示,在工作单和纸笔测试两种评价方式下,户籍对大学生探究能力总分未造成显著差异。

2.各要素分析

工作单和纸笔测试两种评价方式下的各能力要素得分均不呈现正态分布。使用Mann-Whitney U检验来检验户籍下各能力要素是否存在差异,见表19。

从表19的数据看:在工作单和纸笔测试两种方式下,依本次调查所得数据来看,城乡大学生在各能力要素上均没有达到显著性。

表19 大学生各科学探究能力要素得分情况(城乡*能力)

续表19

由以上结果可知:纸笔测试方式下,女生科学探究能力的实际情况优于男生;而工作单方式下,大学生科学探究能力总分在性别、户籍两项上都不存在差异。为此,特就工作单方式下,以性别(F=0.001,p=0.980)、户籍(F=0.001,p=0.980)两项因素之一为自变量,另一项为协变量进行斜率同质假设检验,结果均为p>0.05,满足了斜率同质假设,可进行下一步协方差分析。表20是工作单总分以两项因素为自变量的协方差分析:

表20 大学生科学探究能力协方差分析(工作单)

由表20可知,工作单总分在性别(df=1,F=0.60,p=0.807)、户籍(df=1,F=0.66,p=0.798)上均为p>0.05,差异不显著。这代表性别和户籍这两项因素对工作单下学生的科学探究能力总分没有造成太大的影响。

四、结论与建议

(一)研究结论

1.无论是工作单还是纸笔测试结果显示,就均值来看,目前大学生具备了基本的探究能力。这与学生基础教育阶段的扎实训练紧密相关,同时也为高等教育阶段学生科学探究能力的进一步提升奠定了基础,充分反映出基础教育与高等教育之间的连续性。

2.总体上工作单得分高于纸笔测试,两者结合可以较好地评价大学生的科学探究能力,成本较低,并兼顾了评价的公平性、客观性。

3.不同学生之间能力发展水平不同,两种方式下:校际、高中分科、本科专业三个因素上差异均显著,户籍因素上差异均不显著。性别因素在工作单方式下差异不显著,纸笔测试方式下差异显著。

(二)相关建议

1.对于高校

针对不同专业学生的探究能力水平存在较大差异现象,高校在学科建设方面,要打破学科壁垒,建立学科群。如加强院系之间的合作培养,尤其是理工科与人文社科院系之间的交流合作,及时调整相关课程设置,增加实践课程的比重,辅之灵活的专业主辅修制度,从而实现跨学科的交叉融合研究。在师资配比方面,建设跨学科师资队伍,提高人才培养质量。进一步加强创新人才特别是拔尖创新人才的培养,加大应用型、复合型、技术技能型人才培养比重,以便提升一流人才培养与创新能力。

2.对于教师、评价者

在教学中,教师要因材施教,可以在已开设的实验课程中增加自主实验的比重;根据男女学生不同认知特点,采用男女合作方式,让学生在探究活动中,相互学习,共同进步;此外,要加强与学生之间的交流互动。评价者在评价时,要从两方面进行考虑:一是选择科学合理的评价标准;二是采用多种评价方式综合评价。只有在正确的评价体系基础上,才能使评价的结果合理有效。

3.对于学生

首先要清晰定位自己的科学探究能力水平;其次要掌握提升自身能力的方法,如增加阅读量,积极参与学校院系组织的实践活动,与同学、教师多进行沟通等等。

(三)研究反思

1.被试者的取样

本研究因主客观条件限制,被试数量虽能满足研究的基本需要,但取样范围仍然较窄。在今后研究中,应扩大被试取样规模,增加不同地区、不同学校及不同年级类型的学生,从而增强相关代表性。

2.评价指标体系

本研究建立在工作单及纸笔测试两种方式结合基础之上,两种评价方式起到了很好的互补作用,但有些评价目标(如评价反思中“与他人交流合作的重要性”)未能很好展现出来。在今后研究中,需要开发出多种适合不同探究任务的工作单、纸笔测试问卷,并结合观察法、计算机模拟等形式,形成更加完善的“综合评价学生的科学探究能力”评价体系。

猜你喜欢
纸笔要素测试
“无纸笔”闯关,乐翻天
幽默大测试
掌握这6点要素,让肥水更高效
“摄问”测试
“摄问”测试
“摄问”测试
单宝塔诗
也谈做人的要素
衍纸手工
2015年8月债券发行要素一览表