《语料库口译研究的垦拓》评介*

2015-02-12 06:01北京外国语大学
语料库语言学 2015年2期
关键词:译员口译语料

北京外国语大学 姚 斌

《语料库口译研究的垦拓》评介*

北京外国语大学 姚 斌

Francesco Straniero Sergio & Caterina Falbo (eds.). 2012. Breaking Ground in Corpus-based Interpreting Studies. Bern: Peter Lang. 254 pp.

1. 引言

语料库口译研究是近些年口译研究方面逐渐兴起的研究视角。Shlesinger(1998)首次提出要将语料库方法应用于口译研究,以解决口译研究的一系列核心问题。相较笔译研究,语料库方法应用于口译研究面临诸多挑战,其关键在于口译材料的获取、转写和数据加工,通常数倍或数十倍于笔译语料库建设的工作量。《语料库口译研究的垦拓》一书,汇集了7位学者在口译语料库建设方面的理论思考与实际运用。7篇论文加上导论较为完整地展现了语料库口译研究的前沿领域与研究现状。在内容上,此书既有对语料库口译研究的详尽回顾,亦有利用语料库针对具体口译问题开展的案例研究,体现了近10年来该领域的最新进展。

此书作者多为既从事学术研究、又进行口译实践的“实践–研究者”。因此无论是对不同场景下口译活动特征的理解,还是利用语料库进行口译研究的选题挖掘都表现出较强的针对性。可以说,此书不仅是对此前欧洲语料库口译研究的总结,也体现出该领域研究的未来动向。该书对国内语料库口译研究一定有其积极的借鉴价值。本文将首先简要介绍该书的内容要点,并在此基础上展望语料库口译研究的未来发展趋势。

2. 主要内容

该书有3大主题:口译语料库的现状与展望、口译语料库的建设方法及口译语料库研究案例,共8个章节(含导论)。以下分述相关章节内容。

2.1 语料库口译研究的现状与展望

该书编者Francesco Sergio和Caterina Falbo撰写了题为“通过语料库研究口译”的导论,实为对语料库口译研究的回顾与展望。导论首先勾勒了从语料库语言学到语料库翻译学的一些核心问题,如语料的代表性及翻译共性等。之后作者重点探讨了口译语料库的建设要点。口译语料库创建之所以滞后于笔译语料库,是因为口译具有不同于笔译的诸多特征。作者指出了口译与笔译在认知、伦理、社会文化及意识形态层面的不同特征。正是由于这些不同特征的存在,语料库口译研究的问题意识也有别于以笔译为对象的语料库翻译学。口译活动中所特有的问题,如面子保全策略、非言语交流及译员的角色变化等,都必须融入到口译语料库的创建中。在展望未来发展时,作者指出,语料库口译研究的最大挑战仍是数据的可比性。目前对特定语料库的研究已经产出了一些成果,但如何实现跨语料库的协同研究和共性研究仍有待于加强研究变量和分析方法的互通性。要实现研究的“生态效力”,不仅要求确保数据的获取和数量,而且要求方法论的统一及研究结果的可比性。

2.2 口译语料库的创建方法

共有5篇论文有关口译语料库的创建,它们分别涉及EPIC、DIRSI-C、CorIT、FOOTIE口译语料库和法庭听证语料库,其中法庭听证语料库主要介绍的是语料的获取方法。

Mariachira Russo, Claudio Bendazzoli, Annalisa Sandrelli和Nicoletta Spinolo介绍了EPIC的研制进展。创建于2004年的EPIC,其主要目标是收集大量真实同传语料,并将实证研究的成果用于改善口译培训。对该语料库的建设方法国内已有学者进行过较详细的介绍(如王克非、黄立波 2012),这里不再赘述。基于该语料库已经开展的研究有口译译文中的词汇密度(lexical density)和词汇变化(lexical variety)、口译中的非流利现象、演讲原文主题、语速及方式对译员表现的影响及文本处理模式等。另外该语料库也给口译博士论文的选题与撰写带来了莫大便利。在EPIC的最新进展方面,除了语料数量的扩增,作者还提及通过SpeechIndexer和Transana 2.41等工具对文本/音频以及文本/视频所作的对齐工作。

Claudio Bendazzoli着重介绍了DIRSI-C口译语料库。该语料库收集了3次国际医学会议的意英同传资料。语料库基于EPIC的理论与方法框架,但由于语料来源与前者完全不同,因而具有自身特征。Claudio重点描述了该语料库所收语料的特征及语料库创建的具体方法。该语料库有四个子库,分别是意大利语和英语的原语库和译语库,因此可以同时被用作可比和平行语料库。目前语料库的规模是136,000词。Claudio借用“交际理论”,从会议结构、演讲事件、会议参与方等角度详尽分析了国际会议的“交际情境”,并在此基础上举例说明DIRSI-C文本头文件的结构与内容。Claudio研究的主要目的在于剖析“译员为媒介的国际会议”的基本构成要素,并将之转化为可以用语料库技术分析的语料。

Annalisa Sandrelli介绍的是2008年欧洲足球锦标赛期间每项赛事前后所有新闻发布会同传语料的FOOTIE口译语料库。作者本人也是参与赛事活动的同传译员之一。建设该语料库的目标是:(1)建设足球赛事中以译者为媒介的新闻发布会语料库;(2)分析足球赛事条件下的对话沟通要素;(3)描述同传译员如何处理口译过程中遇到的挑战。该语料库与EPIC和DIRSI-C都不相同,因为它是对话性质的,而非演讲性质。该语料库包含16场新闻发布会,涉及意、英、法、西等四种语言,同时可用于可比和平行语料库研究。

作者首先介绍了足球翻译的特点,描述了足球赛事译员的工作场景、地点及形式等,随后具体介绍了2008年欧锦赛的翻译情况,之后是对FOOTIE语料库数据获取、转写等具体情况的介绍。她特别提到,虽然译者本人参与翻译有可能导致研究中的偏见,但这仍是目前获得真实会议数据的最佳途径之一。在转写方面,她特别强调,转写的语料特征应根据研究目的而定,避免标注不相关的特征。为确保跨语料库的衔接与协同研究,采用了EPIC的转写方法,但未作词性标注,因为研究目的是沟通以及特定的词汇模式。由于其对话特征,因此采用了特殊的转写方式。转写时生成两个文件,一个是不含任何标注的txt版本,可以用于WordSmith工具。另一个是Excel版本,其中一页是新闻发布会的文本头,另外一页为两种(或三种)语言的平行对照版本。文本头记录了所有与特定新闻发布会相关的信息。该文最后一部分,作者从“机构性沟通”1的角度分析了新闻发布会的沟通特征,包括其语言特点、参与者角色、权力关系、视角、议题选择等。作者还指出,未来的研究方向是译员在面对语速挑战时采用的口译策略。

Caterina Falbo介绍的是CorIT(意大利电视口译语料库)的分类标准。CorIT语料库主要收集的是意大利国有电视台RAI自1960年代以来的全部口译语料,同时还加入了来自其他商业电视台的语料,时间跨度大、收集内容多。该库时间跨度达50年之久,包括2700多场口译,为多种外语译入意大利语的交传和同传。该语料库被定义为开放式、多媒体平行语料库,并不断更新。该库建设的重点是:研究CorIT的主要特征及其对“语料库”、“分类标准”等既有概念重新定义的影响,以及如何重新定义研究中的核心概念,如口译模式、互动类型以及电视特征等。

本章主要了介绍该语料库的分类方法。首先介绍了文本头设计。该库文本头设计非常细致,包括:译员姓名、口译模式、互动类型、交际事件参与方姓名、日期、意大利节目名称及播放频道、外国电视台频道、语体风格、电视风格及文本类型(原文/译文)。具体到电视口译的特征,作者指出电视交传更类似于联络口译,译员一般是不带纸笔的,不记笔记,因此发言人的讲话也会比较简明。而在电视同传中,译员往往与讲话人不在同一现场,甚至有时与现场沟通无关。另外作者还提到话轮转换在源语和译语之间的差异,并通过戛纳电影节上多人发言变为译员两人之间的顺序翻译这一案例说明,电视语体风格的分类结构不再固定,而是灵活和开放的,可以不断更新。在转写方面,作者强调应保持文本文件与声音/视频文件之间的永久性联系,建议使用的工具为winpitch。CorIT采用正字法的转写方式,去除了所有标点,以显示与书面文本的不同。可以用它开展翻译、互动及语言层面的各种研究。

Marta Biagini主要介绍了法庭口译的数据收集。他从对话口译的特点谈起,提到数据的收集并非中立,而是与研究者的研究目标相关。他研究的是在法庭这样一个高度形式化和仪式化的场景中,以译员为媒介的互动行为如何发生并产生什么影响。他发现在对译员角色的规定与译员实际行为之间存在差距。在简要介绍意大利的法庭口译情况后,作者主要介绍了数据收集的情况。一种是法庭提供影像资料,可能不符合研究者要求;一种是研究者自己现场录制,但存在审讯时间很长、高品质录像设备昂贵等问题。作者现已收集6名译员9小时法语–意大利语的对话口译视频。他指出今后的研究目标应为:(1)从语料中观察到的行为能否被普遍化,并成为规范,还应只是被视为个人行为?(2)有没有可能思考对“中立”概念的重构,分析所谓的“中立性的影响”?

2.3 口译语料库研究案例

本书有两个章节是应用语料库进行口译研究的实际案例,分别研究了“主题连贯性”(topical coherence)和“译员风格”问题。

Eugenia Dal Fovo呈现了一个利用电视口译语料库研究主题连贯性的案例。这是她正在进行的博士研究。利用的是1988-2004年美国总统大选辩论的口译版本,共计640分钟。其研究目的是探讨译员如何处理对话型及问答结构的原文,及其对译员的影响。

她首先介绍了硕士论文的研究。她将原文中出现的问题分为4大类:(1)Yes/No问题;(2)特殊问句问题;(3)引导性问题;(4)陈述性问题。她对每一种问题在语料库中出现的频次及其译文实现的连贯性程度都作出量化统计。译文分析主要从问题类型、译文连贯性程度、译员采用策略、原文结构保留程度及译文具体内容这几项入手。

她提出将在博士研究中就文本语言学和互动与对话分析等方法论问题进行更加深入的探讨,希望能够解决对话题连贯性的定义问题。由于电视口译的特殊性,译员不在现场,现场沟通也不依赖于译员,因此对于话题连贯性也需有新的定义。她将聚焦于在听众并不知道原文的情况下译员对译文的话题重建问题。

Francesco Straniero Sergio利用CorIT语料库进行了对译员风格的探索性研究。他指出,与利用笔译语料库研究译者风格相比,利用语料库研究口译员风格的研究极少,但较之口译研究中常见的定性研究,基于语料库的译员风格研究更符合描写性译学的原则。他利用前述CorIT电视口译语料库从词汇选择、语言使用、话语标志及听说时间差的角度研究了几名意大利译员的传译风格,通过大量实例证明译员在从事电视口译时的确存在独特风格,例如常用语汇、比喻、结构及语域等。

3. 简评

口译语料库的建设与研究一向被学术界视为畏途。很多研究与其说是对语料库的研究,倒不如说是对口译语料库建设困难的研究。在我国,对于口译语料库的语料加工、对齐级别等问题探讨较多,而对口译活动自身的特点研究较少。其原因可能是多数从事相关研究者并非口译的实际从业者。

本文集的特点之一便是多数研究者均为口译从业者,这既使得他们可以较为便利地获取研究数据,又使得他们能够将自身实践中的问题带入研究中,从而在很大程度上跨越了实践与理论的鸿沟。本文集的另一特点是非常强调跨库研究及方法论的一致性。这一点值得推荐。目前不少语料库研究往往各行其道,不能实现跨库共享,缺少像文集中几位意大利学者这样的协同协作研究。例如DIRSI-C就明确采用了EPIC所使用的分类方法,以便实现研究成果的可比性。

正如本文集中不少学者指出的那样,口译语料库研究的难点在于口译语料发生场景的多样性和复杂性。因此研究中首先要对“以译员为媒介”的交际事件特点进行分析,考察特定场景下的交际事件特点。例如,文集中涉及的EPIC(欧洲议会)、DIRSI-C(医学会议)、FOOTIE(欧洲足球赛事)、CorIT(电视口译)等都是不同场景下的口译语料,因此具有不同特征。我们注意到,文集作者均不惜笔墨地分析特定场景下交际事件的特点。而对此,国内相关研究作得还比较少。国内研究更多关注点是在语料收集、语料加工和标注及检索工具开发上。然而,正如文集多位作者所强调的那样,口译语料库的建设及语料的加工标注,均应以语料库的研究目的而定,因此在建设口译语料库及开展基于语料库的口译研究时,首先需要详尽分析的是口译语料的发生场景及其特征。在这方面,需要跨学科理论,如言语行为理论、交际理论等的适时介入。

如前所述,本文集除介绍语料库构建过程,包括数据收集方法等,也展示了基于语料库进行口译译文及译员研究分析的实例。这两项研究都利用了CorIT,即意大利电视媒体口译语料库。该语料库时间跨度大、涉及译员多,提供了不可多得的研究数据。两项研究都体现了量化与质性研究相结合的特征,尤其是译者风格研究。在语料库翻译学中,译者风格研究已经比较普遍,但在语料库口译研究中尚属罕见。可以说,这两项研究为未来基于语料库的口译研究提供了方法和操作层面的参考方案。

本文集还提出了对一些核心概念的再认识,这是由口译交际的场景特殊性所决定的。例如,电视口译的特点就使得“以译员为媒介的交际事件”有了新的定义。通常情况下,译员是交际双方之间沟通的媒介。然而,在电视口译中,译员往往不在现场,而只是针对收看电视节目的本国听众。文集作者对译员的此种角色定位进行了重新定义。又如,在法庭口译数据的收集过程中,研究者发现“中立”这一口译职业道德中的核心概念在口译规范与口译实践之间存在差距,由此尝试对口译中的这个核心问题进行语料库的探索。

从文集内容来看,对比国外口译语料库发展情况,国内语料库的语料来源比较单一、加工方法与层次比较初级(张威 2012)。仅就语料来源而言,国内目前的口译语料库主要有学习者语料库、记者招待会语料库和英专口译考试语料库,新近还出现了小型的电视口译语料库。以上几种语料库虽有其个性特征,也值得研究,但从使用范围和频率来看,占据目前口译市场90%以上比例的会议口译却几乎没有成规模的语料库。记者招待会语料库的场合比较特殊,译员身份也有特殊性,其语料的代表性不足。而国内电视口译语料库与国外也有差异,国内电视口译员几乎没有专职者,都是临时为之,他们的口译策略和风格,应该是在会议口译实践中养成的,尚未形成独特的电视口译特征。对口译市场的核心群体,即职业会议口译员的语料库建设也才刚刚起步。

来自文集的另一启示是,由于实际会议存在多种类型,如金融、环保、医疗、专业技术等,而各种类型会议的口译又各有特征,因此都有建设语料库进行研究的必要。但在语料库建设过程中,首要问题应该是对这些特定场景下的交际行为进行深入细致的分析,同时还要注意到跨库研究的可行性和协调性。

本文集中的语料库建设与研究也还存在一些值得进一步推进的地方。例如,不少研究还处于未完成状态。其实口译语料库的研究大有用武之地。对于从事译员培养的人来说,最关心的还是语料库研究可以给口译教学带来什么。对于口译学习者,在学习过程中,关注的是有哪些可以从语料库中得到的经验。未来值得探索的问题还有,在译员口译策略的习得和口译风格的形成方面,语料库研究究竟可以带来什么样的启示?对比职业译员语料库和学习者语料库,结合专家–新手研究又能呈现出怎样的差异化特征?语料库研究如何做到描写与解释互补,通过将量化和质性研究相结合的方法,跨越理论与实践的鸿沟,构建一种口译研究的新范式?这些都是我们心中的问题,有待语料库口译研究的进一步垦拓,并给出答案。

注释

1. Galatolo (2002:137)将“机构性沟通”定义为“在沟通中至少有一方通过特定的沟通行为扮演了机构性的角色”。

Shlesinger, M. 1998. Corpus-based interpreting studies as an offshoot of corpus-based translation studies [J]. Meta 43(4): 486-493.

王克非、黄立波,2012,国外双语库研制与应用评析 [J],《外语电化教学》(6):3-10。

黄立波,2013,《语料库翻译学:研究与应用》评介 [J],《外语教学与研究》(4):623-628。

张 威,2012,近十年来口译语料库研究现状及发展趋势 [J],《浙江大学学报(人文社会科学版)》(2):193-205。

通讯地址:100089 北京市北京外国语大学高级翻译学院

* 本文写作得到北京市支持中央高校共建项目青年英才计划(YETP0842)及北京外国语大学2015年基本科研业务费院系自主项目支持。

猜你喜欢
译员口译语料
基于归一化点向互信息的低资源平行语料过滤方法*
美国法庭口译制度研究及启示——以夏威夷州法庭口译为例
医疗口译中口译人员角色的动态转换
口译中的“现场学习”
口译中的“陷阱”
译员扮演何种角色?
略论笔译与口译的区别
口译认知构建中的概念整合——以总理记者招待会的古语诗词口译为例
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法