基于CiteSpace的我国英汉/汉英翻译测试研究综述(2001-2020年)

2021-11-27 07:12展素贤李鸽鸽
考试研究 2021年6期
关键词:效度信度学者

展素贤 李鸽鸽

一、引言

作为一项跨文化交流的活动,英汉/汉英翻译提高了优秀文化对外输出的有效性,是提升国家文化软实力、国际影响力的重要手段[1]。翻译能力是翻译活动不可或缺的组成部分,在中华文化“走出去”的战略背景下,翻译人才培养和翻译能力测评日益受到重视,引发对英汉/汉英翻译测试(以下简称“翻译测试”)的探讨。翻译测试古已有之,我国早期翻译测试始于清代科举考试[2],现今已成为外语教学中的常用测试手段,被广泛应用于各项大规模考试中,如CET-4/6(College English Test Band 4/Band 6,大学英语四/六级考试)、TEM-8(Test for English Majors-Band 8,英语专业八级考试)、硕士研究生入学考试、CATTI(China Accreditation Test for Translators and Interpreters,全国翻译资格考试)等,广大翻译学者和语言教师对于翻译测试展开了广泛的研究。

一些学者对翻译测试现状进行了分析[3,4],研究的时间跨度截至2016年,且以理论探讨为主,缺乏实证数据支撑。鉴于此,本文采用CiteSpace可视化工具和内容分析法梳理2001年至2020年的翻译测试研究,以期了解翻译测试研究现状,并为翻译测试研究的深入开展及外语教学的实施与测评研究提供参考。

二、研究设计

(一)研究问题

1.我国翻译测试研究的整体趋势如何?

2.我国翻译测试研究在研究方法上有何特点?

3.我国翻译测试研究的研究热点及前沿有哪些?

4.我国翻译测试研究的研究主题有哪些?

(二)数据来源

数据来源于CNKI(China National Knowledge Infrastructure,中国知网)数据库,以“翻译测试”和“翻译考试”为主题词,检索了2001-2020年期间发表的所有期刊文献,得到363篇,剔除书评、会议记录及与翻译测试研究无关的文献后,共得到349篇有效文献作为本研究的数据样本。

(三)研究方法

运用可视化工具CiteSpaceV.5.7.R2和内容分析法对数据样本进行分析。首先,统计了2001-2020年期刊年发文量,得到年发文量变化趋势图;其次,采用内容分析法对数据样本的研究方法进行分类统计,得到研究方法分类统计表;最后,利用CiteSpace可视化工具,绘制关键词共现知识图谱、突现词分布图及聚类知识图谱。分析上述图表,再结合内容分析法,得到我国翻译测试研究的整体趋势、研究方法使用特点、研究热点、研究前沿和研究主题。

三、结果与分析

(一)研究趋势

为了解翻译测试研究的整体趋势,统计了2001-2020年期刊年发文量(见图1)。从总体来看,20年内共发表论文349篇,年均发文量17篇,发文量较少。

图1 翻译测试研究年发文量变化趋势图

根据年发文量变化趋势图,翻译测试研究可分为如下三个阶段:(1)2001-2005年,为起步期,共发文20篇,年均发文量4篇,发文量较少,增长缓慢;(2)2006-2016年,为发展期,共发文265篇,年均发文量24篇,并于2014年达到峰值的36篇,发文量明显上升,内容多涉及大学英语四、六级考试中的翻译测试题型研究,这可能是由于自2013年12月起,全国大学英语四、六级考试委员会将四、六级考试中的翻译题型及分值进行了调整;从图1还可发现,这期间出现五次回落,几乎每次回落都伴随着回升,2009年回升速度最快,这可能是由于国家对高水平翻译人才的需求量增加,加之国务院学位委员会在这一年批准40所院校设置翻译硕士专业学位点[5],使得越来越多的学者关注翻译教学及翻译测试研究;(3)2017-2020,为稳定期,共发文64篇,年均发文量16篇,翻译测试研究趋于平稳。

从整体来看,翻译测试研究处于增长趋势,但图像高低起伏,呈现波浪式的变化,说明当前翻译测试研究发展仍不稳定。

(二)研究方法

为了解翻译测试研究所采用的研究方法有何特点,依据研究方法的分类标准,采集的349篇文献分为实证研究和非实证研究两类(见表1),其中提供“研究对象、研究工具、数据收集、分析”等相关详细信息的研究归为实证研究,否则为非实证研究[6]。

表1 翻译测试研究的研究方法分类统计

翻译测试研究中非实证研究的比例远大于实证研究,说明国内学者更多关注对翻译测试理论的思考,而对测试研究的实证探索较少。

尽管如此,在翻译测试研究发展的三个阶段中,实证研究呈逐步增长态势。第一阶段中,非实证研究占统治地位,说明学者常采用内容分析法探讨翻译测试中的问题。而在第二阶段,实证研究逐渐增加,多数学者采用问卷调查、访谈、测试、语料库等方法,或调查教师在课堂教学中常用的翻译测试形式,或了解学习者在语言习得过程中的问题,也有少部分学者借助有声思维法、Rasch模型或混合法探究评分员的评分行为。到了第三阶段,实证研究所占比重基本与非实证研究相当,学者主要采用翻译测试调查学生对语言知识的掌握情况或进一步探讨有关翻译测试的理论问题。

总体来看,在翻译测试研究领域内,学者常常运用内容分析法、问卷调查、访谈及测试,较少使用有声思维、概化理论、Rasch模型等研究方法。

(三)研究热点和前沿

关键词出现的频次及中心性的大小可以反映研究热点的分布情况,频次高、中心性大的关键词体现了一段时间内的研究热点[7]。笔者使用可视化工具统计了关键词出现的频次及中心性的大小,对翻译测试研究进行了研究热点追踪,采用寻径法(Pathfinder)生成节点为772、连线为1594、密度为0.0054的关键词共现知识图谱(见图2)。在关键词共现知识图谱中,关键词呈现的节点大小与其出现的频次呈正相关。

从图2可见,“翻译测试”的节点最大。除搜索用的关键词“翻译测试”以外,“翻译教学”、“翻译能力”和“反拨作用”的节点较大,说明此类关键词出现的频次较高。此外,共现知识图谱呈树状交叉,点少线多密集度高,表明关键词的分布较为集中,主要围绕“翻译教学”、“翻译能力”和“反拨作用”这三个关键词。

图2 翻译测试研究的关键词共现知识图谱

为进一步探究研究热点,笔者统计了高频关键词及其中心性(见表2)。如表2所示,除“翻译测试”,“翻译能力”的高频率和高中心性反映了学者对测试构念的高关注度;“翻译教学”及“翻译”说明了学者多考察测试与教学的联系;“反拨作用”“大学英语”“大学英语教学”这几个关键词高频出现,说明国内学者多关注翻译测试对英语教学的反拨作用,认为翻译测试与教学密切联系,是教学中的一个重要环节[8]。同时,也进一步说明了翻译测试不仅可帮助翻译教师掌握学生的翻译能力,亦可用于英语教学中,以便教师了解学生对英语内容的掌握情况;“效度”和“信度”的出现展现了学者对翻译测试有效性和可信度的探索;“翻译资格考试”说明学者更多关注大规模标准化考试的相关内容。以上进一步印证了在翻译测试领域,翻译教学、翻译能力和反拨作用是研究的热点问题。

表2 翻译测试研究的高频关键词及其中心性

为进一步了解翻译测试研究前沿,借助可视化工具,对关键词进行了突现性检测(见图3)。按突现强度的大小,排名前三的关键词依次是“大学英语”(2.71)、“信度”(2.09)和“测试”(2.01),并分别于2007、2009和2007年成为突现词,其历史跨度较长,延续至今,说明大学英语、信度和测试研究等一直是研究者关注的前沿问题。

图3 翻译测试研究的突现词及其分布图

综上,翻译测试研究形成了以翻译教学、翻译能力和反拨作用为核心的研究体系,涉及的前沿问题包含大学英语、信度和测试研究。

(四)研究主题

借助可视化工具中的LLR(Log-likelihood Ratio,对数似然率)进一步对关键词进行聚类分析,得到模块值Q=0.7951、平均轮廓值S=0.9127的关键词聚类图谱(见图4)。从图4可见,共有14个聚类类别,依次为#0翻译测试、#1有声思维、#2翻译、#3大学英语教学、#4信度、#5翻译能力、#6问卷调查、#7翻译资格考试、#8翻译水平、#9影响因素、#10汉译英、#11汉英翻译、#12英语教学、#13司法翻译。按照同类别标准对这14个聚类进行整合,共得到三类:(1)研究主题,包括#0翻译测试、#2翻译、#3大学英语教学、#4信度、#5翻译能力、#7翻译资格考试、#8翻译水平、#9影响因素、#12英语教学;(2)研究方法,包括#1有声思维、#6问卷调查;(3)研究的文本类型,包括#10汉译英、#11汉英翻译、#13司法翻译。

图4 翻译测试研究的关键词聚类图谱

聚焦研究主题,结合表2,通过进一步研读和分析文献发现,过去的20年中,翻译测试领域呈现出如下六类研究主题:

1.翻译测试的定位研究

关于翻译测试的定位依然是一个悬而未决的问题,包括翻译测试的概念界定及其研究定位。穆雷认为,翻译测试是检验应试者翻译实践能力的一种手段[9];杨冬敏和穆雷则将翻译测试定义为一种旨在测量应试者翻译能力的考试[10]。这两种概念所明晰的翻译测试构念虽无太大差异,但对于测试本质的理解,即是手段或考试,前者的指涉范围似乎大于后者。

此外,研究者试图从理论层面探讨翻译测试的研究定位,但尚未达成共识。部分研究者认为翻译测试本质上属于语言测试,因其是一种行为测试[11-13]。对此,有学者持不同看法,认为翻译测试和语言测试并非完全对等的关系,在测试目的、测试对象及语言能力上存在差异,在研究中不可将翻译测试作为语言测试的一部分[14]。同时,有研究者认为翻译测试既属于翻译教学的研究范畴,因其以考查应试者的翻译能力和外语能力为主,又属于心理测试的下属学科,因其具有心理测试的基本特征[15];而另一些研究者则认为,翻译测试属于应用翻译学的研究范围[16,17]。

可见,翻译测试与多个研究领域相关,如翻译学、语言学、心理学和测试学等,未来研究应掌握翻译测试的独特之处,借鉴相关领域的研究成果,以厘清翻译测试的定义及其所属领域。

2.翻译测试构念研究

第二类研究主题聚焦翻译测试构念研究,即翻译测试欲检测的目标能力。从分析结果看,大多数学者认为翻译测试构念主要包括语言能力[18]、翻译技巧及翻译知识能力[19];部分学者认为文化能力和审美能力[20]、转换能力[21]、超语言能力、工具能力和心理生理素质[22]等也应成为翻译测试构念不可或缺的要素。此外,随着职业化翻译的发展,越来越多的研究者认为职业道德、翻译速度亦应为职业翻译测试构念的要素[23]。

虽然学者对于翻译测试构念的诠释不尽相同,但一致认为翻译测试构念由一系列子能力构成。此类研究注重分解翻译测试构念,但与测试构念相关的实证型研究几乎处于空白状态。

3.翻译测试的反拨作用

第三类研究主要探讨翻译测试对教学的反拨作用。一些学者认为,翻译测试能够检测学生对教学内容的掌握程度[24]及学生的外语能力水平[25];另外一些研究者采用语料库、问卷调查或翻译测试的方法展开系统的实证研究,或了解学生对某一具体教学内容的掌握情况,如假被动式[26]、二语语块[27]等,或考察学生的综合语言能力[28]、中西文化批判能力[29]等某一特定能力的水平。

可见,翻译测试与外语教学息息相关,进一步印证了翻译测试是外语教学中经常用来评估学生语言能力的重要方法。

4.翻译测试效度研究

第四类研究涵盖翻译试题效度和评分效度。有研究者提出,需根据翻译测试的目的增加客观题、改译、填空、选择、正误判断、转换、简答、译文评析等多样化的测试题型,以提高翻译测试的效度[30]。

在评分效度研究中,为提高人工评分的有效性和可信度,一些研究者提出了诸如制定汉英翻译的分析性评分细则[31,32]、制定模糊综合评分模式[33]等措施;而其他研究者采用有声思维和问卷调查法编制了翻译评分策略问卷,并证实该评分策略具有良好的效度[34]。

为克服人工评分中存在的主观性因素,有的学者开发了一款名为YanFa的网上测评系统[35],有的学者则运用多元线性回归方法构建自动化评分模型[36]。

但是,以上对题型设计、评分细则、自动化评分模型效度的探讨多停留在理论思辨层面,尚需加强相关方面的验证研究。

5.翻译测试信度研究

第五类主题涉及自动化评分信度、评分方法信度和评分员信度。因涉及两种自然语言的处理,翻译自动评分具有更大的难度,导致学者对自动化评分信度的关注度较低,从所检索的文献看,仅有两位学者对此进行了研究:田艳采用词语匹配、词语语义相似度计算和句式模板匹配的方法[37],江进林和文秋芳利用回归分析发现自动化评分信度与人工评分信度具有较高的相关度[38]。

在评分方法信度研究中,研究者主要针对翻译测试的整体印象法、错误扣分法、分项评分法、综合法这四种评分方法下的信度进行了研究,但研究结果存在分歧。例如,肖维青指出整体印象法的评分员信度低于错误扣分法[39];而陈怡认为整体印象法的评分信度高于分项评分法[40]。这两项研究的结果产生差异的原因可能在于评分项目篇幅的长短,较长篇幅的翻译文本其各个部分的情况不平均,难以整体把握。

在评分员信度研究中,肖维青通过问卷调查和信度验证证实了培训评分员及网上阅卷的自查功能有利于提高评分员信度[41];江进林等运用多面Rasch模型得出,评分员的严厉度不受考生性别和具体考生的影响,评分员在对所有考生(30名男生,270名女生)评分时,保持了较为一致的评分严厉度,但会因评分项不同而不同[42];江进林和文秋芳运用多面Rasch模型发现评分员的严厉度虽存在显著性差异,但未呈现集中趋势或两极化趋势,具有良好的内部一致性[43]。

由此可见可见,自动化评分信度和评分方法信度研究仍有待加强;评分员信度研究主要聚焦评分员的严厉度差异,评分员的特征如性别、评分经验等则较少涉及。

6.翻译资格考试

此类研究主要聚焦大规模的标准化翻译考试,涵盖面广,包含清朝翻译科举的形成[44],国内翻译资格考试的实施情况及特点[45],国外翻译资格考试的概况、评分标准、评分流程等[46,47],以及国内外翻译水平考试的对比[48]。

可见,此类研究对标准化的翻译考试进行了仔细的介绍和分析,但国内尚未有学者进行标准化翻译测试的效度验证研究。

总体而言,翻译测试研究涉及其定位、构念、反拨作用、效度研究、信度研究及翻译资格考试六类主题,多以理论思考为主,少有学者运用实证研究方法探究试题、评分方法、应试者、评分员等对信度和效度的影响。

四、结语

翻译测试历史悠久,应用广泛,对国家翻译人才培养及语言教学发挥着重要的作用。虽略滞后于写作测试、口语测试等行为测试研究,但近20年来,翻译测试研究取得了许多优秀研究成果。运用CiteSpace可视化工具和内容分析法,本文回顾了2001-2020年间翻译测试的研究成果,发现相关研究呈以下特点:第一,翻译测试研究整体处于上升态势,但发展不稳定;第二,翻译测试研究主要运用内容分析法、问卷调查、访谈和等方法,较少采用概化理论、Rasch模型等方法;第三,翻译测试研究主要围绕翻译教学、翻译能力及反拨作用等关键词展开,聚焦大学英语、信度和测试研究等前沿问题,但缺乏对翻译测试效度的深入探索;第四,翻译测试研究涵盖翻译测试的定位、翻译测试构念、反拨作用、效度研究、信度研究和翻译资格考试六类研究主题,但常聚焦理论层面,较少涉及评分方法、应试者、评分员等对测试信度和效度影响的实证探究。

针对已有研究的不足,建议未来翻译测试研究可聚焦于以下方向。首先,加强翻译测试的跨学科研究。翻译测试具有较强的跨学科属性,涉及翻译学、语言学、测试学、心理学、教育学等多个学科,未来研究应善于运用翻译测试的特点,避免研究走向单一化,广泛借鉴相关学科理论、方法、研究成果等,以全面深化翻译测试研究。其次,丰富研究手段,充分运用问卷调查、个案分析、有声思维、访谈等方法对学生的翻译能力、教师评分的认知策略进行分析,以便能够有效反拨外语教学;还需借鉴概化理论、Rasch模型等测试研究方法,进一步提高信度验证和效度验证的科学性。最后,需深化及拓展翻译测试研究主题。评分量表是对语言使用者语言运用能力一系列分等级的文字描述,是衡量考生口语、写作、翻译等语言行为表现的主要参考依据,好的评分量表有利于提高评分信度[49],因此,在已有翻译测试构念研究的基础上,未来研究应探究开发或优化翻译测试评分量表的策略并考虑该评分量表的可操作性;围绕已建立的评分细则、自动化评分模型展开效度验证,发现存在的问题,并提出相应的修改建议,为翻译测试功能的实现做出贡献;此外,评分员信度是衡量测试质量、确保其公平公正的主要指标,但往往受到评分员性格、评分经历等因素的干扰,未来研究应聚焦评分员信度,尤其需考察评分员的评分经历、培训时长、研究背景等特征对翻译测试评分信度的影响。

总之,我国学者应更多运用科学、适当的测试学方法,借鉴相关学科的理论成果,以拓展和深化翻译测试研究主题,更好实现翻译测试对外语教学的反拨功能,有效发挥译者作为文化传播者的作用,进一步推动中华文化“走出去”。

猜你喜欢
效度信度学者
学者介绍
学者简介
学者介绍
作为数学教育研究质量分析的信度
来华留学生对全英文授课教学服务满意度量表的信度和效度分析——以昆明医科大学为例
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
作为数学教育研究质量分析的效度
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
学者介绍