对天津市初中毕业生学业考试命题工作的思考

2009-12-01 02:43
天津教育 2009年10期
关键词:效度测验信度

郑 刚

2003年秋季,作为国家级课改实验区的天津市大港区在六年级(本区初中的起始年级)正式启动了新课程改革的实验,拉开了天津市初中新课程改革的序幕。2005年秋季,全市进入初中课程改革。2008年,天津市组织了首届初中毕业生的学业考试与考查,较前几年相比,呈现出考试内容多元、考试形式多样等特点。为了进一步推进新课程改革,实施素质教育,充分发挥学业考试的正面导向作用,笔者认为有必要对命题工作进行梳理和反思。

一、学业考试的基本情况

学业考试是义务教育阶段的终结性考试,学业考试成绩既是衡量学生是否达到毕业标准的主要依据,也是高中阶段学校招生的重要依据之一。按照天津市教委每年印发的关于天津市初中毕业生学业考试说明以及考试方案的要求,近两年天津市的学业考试呈现了以下特点。

1.考试内容多元。学业考试科目为语文(含作文)、数学、外语(含听力)、物理、化学五科,考查科目为思想品德、历史、地理、生物,以及理化生实验,区县级考查为综合实践活动(信息技术、研究性学习、劳动与技术教育)、音乐、美术。其中,体育与健康学科在2008年为区县级考查科目,2009年为市级考试科目。

2.考试形式多样。一是既有纸笔测试,又有实验考查。二是在纸笔测验中,思想品德、历史学科实行开卷考试。允许学生自带一些参考资料进入考场,以考查学生收集、选择、运用资料的能力。三是各学科考试题目中都有数量不等的开放性题目,鼓励学生自由想象,培养学生的创新精神。

3.考试结果多样。近两年学业考试中考试科目的成绩以原始分数呈现,考查科目的结果以等级形式呈现。事实上,等级制与百分制或与其他形式的分数并没有本质的区别。但是,在实现新课程改革目标方面,等级制能发挥较好的导向作用。学业考试采用等级制,可使高利害点明显减少(高利害点只是那些被用来划分不同等级的有限的几个分值)。而且,等级制有意模糊同一等级内部的差异,这为高中校在录取时参考其他测评指标、综合考查学生的能力和水平提供了空间,为高中招生的多样化创造了条件。

二、依据课标,科学命题,实现了三维考核目标的统一

1.紧扣学科课程标准。在命题过程中,注重“三维目标”的和谐统一。在知识与技能方面,重点考查学科知识结构中的核心内容和基本技能;在过程与方法方面,重点考查学生运用所学知识与技能分析和解决实际问题的能力,以及探究新知识的能力;在情感态度与价值观方面,虽未采用直接设题赋分的方式进行考查,但将有关内容渗透在前两个方面的考查中,并从试题材料的选取和评分标准的角度加以考查。

2.加强与社会实际的联系。在命题过程中,凸显科学精神和人文精神。主要表现在选材的时代性,材料选择或题目选项紧贴社会的焦点及热点问题。题目设置新颖,形式多样,开放性较强。

例1:(化学)我国水资源位居世界第六位,但人均水量为世界第八十几位,而天津市在我国人均水量位居三十多位,属于极度缺水地区。所以,我们要节约用水。

(1)“中水”是指生活污水经处理达到规定水质标准的,可在一定范围内再次使用的非饮用水。现要将一种含有碎菜叶、泥沙等不溶物和有臭味的生活污水净化处理成“中水”,根据你了解的知识,请回答:

①欲除去此污水中的碎菜叶、泥沙等不溶物,可采取_______方法;

②要除去此污水的臭味,下列物质中可使用的是________;

A.活性炭B.小卵石

C.棉花

(2)为保护有限的水资源,你对节约用水有何建议?(提一条建议即可)

3. 加强与学生生活实际的联系。让学生深切地感受到学习与生活是密切相关的,只有学好知识,才能学以致用。

例2:(物理)以下是某同学估测的一些数据,其中符合实际的是

A.夏天大港地区的最高气温可能超过30 ℃

B.一名中学生的质量可能是50 kg

C.教室内天花板离地面的高度约为10 dm

D.人的正常步行速度约为80km/h

4.注重考查学生的应用能力。考查学生在具体情景中综合运用所学知识分析和解决实际问题的能力。

例3:(数学)如图,小明想知道池塘两端A、B间的距离,但无法直接测量。学习数学有关知识后,他想出一个主意:在地上选取一个可以直接到达A、B两点的点O,然后连接OA、OB,且在OA、OB上分别取它们的中点C、D,再连接CD,并测得CD = 20 m,由此可得到A、B间的距离是

(A) 10 m(B) 20 m

(C) 40 m(D) 60 m

5.试题形式多样,图文并茂。通过一些小图片的形式,让试卷的呈现更加生动、活泼,并辅助和加强学生对题目的理解。

例4:(地理)下列物品中具有天津地方文化特色的是

三、科学评价,积极反馈,发挥学业考试的服务功能

试卷的质量由各指标来综合评价,决定试卷质量的指标较多,且诸指标间相关程度很高,一般衡量试卷质量的指标主要有难度、信度、区分度和效度,需要在命题中牢牢把握。

1.难度适中,题量适宜。

难度是指试卷或试题的难易程度,它是试卷题目对学生知识和能力水平的适合程度的指标。一份难度适中、题量适宜的学业考试试卷,是衡量学生是否达到毕业标准的主要依据。

问卷调查显示各学科的题量比较合适。若题量再增加的话,会给考生造成一定的心理压力,不利于考查学生运用知识分析问题、解决问题的能力,尤其是创造性思维能力。因此,随着试卷结构和题型的调整,应尽量使试卷题量适度。

2.具有一定的区分度。

所谓区分度是指测验题目对学业水平不同的考生的区分程度或鉴别能力。如果一道题,学业水平、实际能力都较高的考生都答对,学业水平、实际能力都较低的考生都答错,则可认为该题目有好的区分度。只有很好地把握区分度,才能充分发挥学业考试在高中学校招生中的选拔功能,成为高中阶段学校招生的重要依据之一。

3.试卷信度可靠。

信度是指考试的可靠性,即考试结果的可信程度。信度高的试题很少受到外部因素的影响,对任何学生的多次测定都会产生比较稳定的、前后一致的结果。一般而言,检验试卷信度的指标有:重测信度、复本信度、分半信度以及评分者信度等。

在编制学业考试试卷时,需关注评分者信度问题,以提高评分的可靠性、稳定性和一致性。一是确定答题要点。主观题答案的标准化,可以使评分者依据所提供的标准进行评分,减少评分者主观因素以及外界不稳定因素的影响。二是多个评分者评分。多个评分者评分可以平衡彼此之间的主观因素的影响。

4.效度较高。

效度,是指测量的有效性,即测试结果与测试目标的符合程度。试卷效度通常从内容效度和结构效度两方面进行分析。

为提高试卷的效度,应采取三方面的措施:一是根据课程标准进行命题,且各单元试题分数分配与学时数分配基本保持一致,成正比关系,这是保证考试效度的基础;二是在命题的同时,制订试题参考答案与评分标准;三是在阅卷过程中,采取集体阅卷且实行流水作业。此外,由于学业考试兼有评价学生学业成绩和选拔的双重功能,所以,对学业考试试卷还可以进行效标关联效度检验。所谓效标关联效度,就是指学业考试成绩与学生在高中的学习成绩的相关程度。如果学业考试成绩好的考生,在高中的学习成效也很高,就说明学业考试试卷是一份好的试卷。

四、对学业考试命题的思考

为进一步深入研究和实施初中毕业生学业考试命题工作,笔者认为有必要在理论上正确认识,在实践上妥善处理以下几个重要关系。

1.课程目标、教学活动与考试评价的关系。要实施课程整合评价,因为考试评价具有很强的导向性功能,如果避开考试评价来进行课程、教学设计,就有可能导致教学与考试评价关系异化,课程内容窄化,以及考试评价的教育功能弱化。

2.定量评价与定性评价的关系。定量评价往往忽略难以量化的品质与行为,忽视个性发展与多元标准。定性评价更能体现现代人本思想和发展性评价理念。应在传统定量评价的基础上逐步增加定性评价,从表征性的分数机制向实质性的内容机制转变。

3.静态评价与动态评价的关系。动态评价有两层含义,一是跨越每个时间观察、评价学生,从而了解学生的动态认知历程与认知能力变化的特点和潜能;二是评价者与被评价者的互动,强调评价与教学相结合,实施个体化的诊断、评价与教学补救。

4.结果评价与过程评价的关系。过程评价是针对课程实施过程或学生学习过程所进行的评价,经常采用形成性测验评价和诊断性测验评价方法。

5.客观测验评价与主观测验评价的关系。客观测验往往局限于对学科简单知识和原理的考查,面对表达能力、组织能力、创造能力等高级心智技能及心理过程则难以考查。而这些不足正是主观测验的优点。

6.纸笔测验评价与表现性测验评价的关系。纸笔测验多局限于认知领域的教学目标,不能关注情感、态度、动作技能、心理素质与学生的实际动手能力和创新能力,而表现性测验评价侧重于把知识与技能应用于实际,强调实做与表现。二者相辅相成,相得益彰。

学业考试是一项复杂的社会系统工程,关系到千家万户,是政策性、实践性很强的一件大事。命题工作更要逐步适应时代的变革、教育的发展,只有这样才能发挥学业考试的巨大功能。我们只要用科学态度去研究、探索和实践,相信学业考试命题改革之路会逐渐清晰地展现在我们面前。

(责任编辑韩大勇)

猜你喜欢
效度测验信度
《广东地区儿童中医体质辨识量表》的信度和效度研究
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
《新年大测验》大揭榜
两个处理t测验与F测验的数学关系
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
被看重感指数在中国大学生中的构念效度
外语形成性评估的效度验证框架
中文版脑性瘫痪儿童生活质量问卷的信度
复杂图形测验对区分阿尔茨海默病与非痴呆的诊断效度