口译机器翻译的理论探索

2017-04-08 01:52魏徳蛟
成长·读写月刊 2017年3期
关键词:机器翻译口译

魏徳蛟

【摘 要】文章认为口译机器翻译不仅有理论实现的可能,而且有投入实际应用的可能。文章从施莱尔马赫和纽马克的论述中找到理论支撑,认为翻译之所以有机器不可操作的地方,是因为机器只能处理一一对应的东西;对于一对二、一对多的情况,用机器来翻译的可能性相对较小,只能借助语料库和其他途径才能实现。文章从现有的软件出发,将现有的软件加以组合,连接成一个口译翻译系统软件,并从宏观和微观两个方面对其进行了设计分析。

【Abstract】The paper believes that machine interpretation is not only possible in theory; it also can be put into in practice. The article finds the theoretical support from Schleiermacher and Newmark. It analyzes why translation can not be operated by machine, it is because machine can only deal with one-to-one equation. While for one-to-two equation, which has few possibilities to put into practice in machine, can only be achieved with corpus and other means. This article combines the existing software into interpretation system software from the existing software, and analyzes its design from both macro and micro aspects.

【关键词】口译;机器翻译;翻译系统

【Key Words】interpretation; machine translation; translation system

引 言

機器翻译发展到今天,经历了很多个阶段,出现了各式各样研究和宣传,冯志伟在1999年第5期的《中国翻译》上,在《机器翻译—从梦想到现实》一文中提到下面一段文字:

1987年10月在瑞士日内瓦召开的TELECOM87会议期间举办的最新通信技术国际展览会上,表演了自动翻译电话试验。他们把机器翻译系统与办公用通讯网(NTT, KDD, PTT)等结合起来,利用通信卫星,在瑞士与日本之间通话,在日本的通话者讲日语,在瑞士的通话者可以听到经过机器翻译得到的相应的英语口语译文,在瑞士的通话者讲英语,在日本的通话者可以听到经过机器翻译得到的相应的日语口语译文。在会议召开的八天之内,近百个与会者进行了自动翻译电话通话试验,一时引起轰动。不过,由于机械翻译、语音的识别与合成都是十分困难的技术,集这些困难技术于一身的自动翻译电话的实用化决不是可以一蹴而就的。

这是一个非常诱人的发展前景,但其也提出了发展的困难和挑战。然而今天,这些困难得到了相对的解决,因此,我们的机械翻译可以得到进一步的发展了。

一、理论综述

机械翻译要取得发展,需要我们从理论上对其进行论证,看其是否可以使用计算机进行操作,下面我们就从源头上去找一下口译机械化是否可行的依据。

(一)机械翻译分类

我们知道,施莱尔马赫(谭载喜,2004:106)是西方第一个把笔译和口译明确区分,并加以阐述的人。他指出:

1.翻译分笔译和口译。口译者主要从事商业翻译,而笔译者则主要从事科学艺术翻译。书写的语言适合于科学艺术的记录,因为只有书面的东西才能使科学艺术得以保存;要把科学和艺术上的成就口译出来,一是难于做到,二是做到了也于事无补。但在日常事务和商业活动中,书写只是一种机械的手段,口头的东西是原话,书面材料是口头材料的记实,而口头翻译本身则又是一种机械的活动。

口译作为一种高速进行的翻译活动,需要在短时间内,由于没有时间反复思考,正如施莱尔马赫所说,口译是一种机械的翻译活动;既然是一种机械的活动,就意味着可以用机械来处理。施莱尔马赫(谭载喜,2004:107)接着又对翻译进行了分类:

2.翻译分真正的翻译和机械的翻译。这一点和上一点紧密相关。所谓真正的翻译,是指文学作品和自然科学作品的翻译;所谓机械的翻译,是指实用性的翻译。笔头翻译属于真正翻译的范畴,口头翻译则属于机械翻译的范畴。商业翻译工作者处理的大多数是有形可见的东西,或至少是有比较精确定义的东西,在某种程度上,所有交易都会涉及算术和几何,因而总可借助于数学和度量衡。除非说话人有意把话说得模棱两可,或由于不假思索而出现错误,那么,任何人只要知道说话人的话题,并懂得他的语言,就不会听不懂他的话;听话人和说话人之间一般不会出现语言使用上的鸿沟。而且,在一种语言里也很少找不到与另一种语言相应的表达方法。因此,在这种范围里的翻译几乎完全是一种机械的活动,只要对两种语言有所掌握,谁都能够胜任。同时,在这种翻译中,只要没有明显的错误,便很难有好坏之分。然而要把科学和文学艺术品从一种语言转移到另一种语言,就会遇到两种互不相同的因素。一方面,如果甲语言的某个词与乙语言的某个词完全相应,表达的是相同分量的相同概念,而两种语言的词尾变化表达的又是相同的语法关系,彼此的区别只在于所用词的发音不同,那么,科学文学作品的翻译就纯粹是机械的翻译,在传递作品的内容方面同于商业翻译。另一方面,如果语言不完全受有形物体或外部事实的制约,如果表达这些物体或事实不是言语的惟一目的,也就是说,说话人是在独立思维,所表达出来的东西是这种独立思维的结果,那么说话人和他所用的语言之间就会有一种复杂的双重关系,而只有当这种关系被正确地领悟了,说话人的言语才可能被正确地理解。这样,科学文学作品的翻译问题就复杂了,它直接关系到独立的语言思维和创造。这种翻译是一项创造性的活动,需要译者有较高的理解力和解释事物的能力,能把自己的语言和所译语言融合起来,使译作能得以保留原作的风格。

从施莱尔马赫的分析中,我们不难看出,口译纯属于机械翻译,而笔译既有机械的一面,又有创造性的一面,这就是为什么文学翻译既有可操作性的一面,又有不可操作的一面。换句话说,翻译既有固定的科学成分,也有复杂的艺术成分,对于简单的、固定的、有规律的科学成分,机器翻译实现的可能性比较大,因为机器一般情况下只能处理一一对应的东西,对于一对二、一对多的情况,必须靠软件程序才能实现,对于一对二、一对多的情况,用机器来翻译的可能性相对较小,只能借助语料库才能实现。

纽马克(谭载喜,2004:213-214)也认为翻译既是科学,又是艺术。他指出:

从性质上说,翻译既是科学,又是艺术。说它是科学,是因为语言中有些东西已经标准化,只允许一种译法。例如科技术语一般只有一个译名。此外,还有常用的比喻、成语、谚语、惊叹语、文告语、社交用语、时间用语、度量用语、各个语域的典型用语等等,往往都只有一种固定的译法。

说翻译是艺术,是因为语言中有些东西远非标准化,允许有多种选择,多种译法。但目标文本也必须受到科学的检验,以便一方面避免明显的内容和用词错误,另一方面保证目标文本同源文本一样行文自然,符合语境要求。

可以说,翻译是科学,也是艺术,除了已经标准化,只允许一种译法的科学外,翻译是科学还在于所有的艺术成分必须在各种语言的语法规则内进行创造,而所有的语法规则都是一些有规律的科学规范,它们规定着人们进行语言活动的范围,交际的方式等。因此,艺术也必须是科学的艺术才能被人们接受和认可。

我们要用机器来进行口译,就必须从翻译的科学成分入手,因为科学的东西必定有规律可循,而这些规律就为计算机的操作提供了可能,同时也为我们用计算机来翻译提供了可能性。

二、口译机械化的优势

目前,口译走向机器化的条件逐渐成熟,其条件有二:一是语音识别率越来越高,二是机器翻译的完美程度也越来越高。口译用机器来处理,由于其本身的特点,有着人类所不具有的特定优势。

1.口译需要译者反应速度快,而计算机在这一点上比人更有优势,再者,口译员会疲惫,而计算机则可以长久地工作。

2.随着语料库的完善,平行文本会为机器翻译提供更多的施展空间,机器翻译的完美性会随之增强。

3.我们知道,一般需要口译的材料,都有相对固定的模式,而计算机恰好是以固定的模式工作的机器,这又是切合计算机特点的又一个翻译优势。

4.人常常会因记忆误差等原因而时常犯错,而计算机则不会。人会因紧张等心理因素而支支吾吾,而计算机则不会有这方面的问题。

5.研究经费有保障,大家知道,当前口译人才相当吃香,口译人的收入是以小时来计算的,每年国家花在口译人才上的费用,是相当巨大的,要是能把相当的费用花在开发口译软件上,那是一个相当有长远意义的工程,他为其他方面的发展也会有一定的带动作用。

6.而目前所说的机器翻译,从来就不曾试着把其用于口译,在文学翻译方面,由于常常会有多义词的出现,同一个意思可以用多种表达方式来实现,使得文学翻译充满了变数,而口译则不一样,它常常一一对应的,可操作性是很强的。

也许有的人会说,目前即便是简简单单地把一篇文章用翻译软件翻译出来,其翻译出来的质量也是值得商榷的,更何况用于口译方面的呢?可是从施莱尔马赫的分析可知,这一定是不懂口译的人说的。如果他是一个口译人员,他会发现口译的模式大体上是固定的,商业方面有商业方面的词汇,法律方面也有法律方面专门的词汇,即便是很多国家领导人的演说词,那也是有很多相似的地方的。

三、口译机械化

根据目前所具有的软件,将口译机械化,现在条件已经基本成熟。我们知道,现在的IBM viavoice 9, 可识别率已经超过了90%,对于需要进行口译而发言的人,其语音一定不错,其识别率就更高了!而对于Systran 和Trados,现在谷歌的翻译已经达到相当的水平了,对于有语料支撑的口译文本来说,应该不会有太多的问题。如果能用口译首先来开拓机器翻译,那会给机器翻译带来不少的科研资金,反过来又促进了机器翻译的发展,可以说,未来机器翻译的发展前景还是比较乐观的。

要用机器来进行口译,难点就在于IBM viavoice 9的文字记录和两种语言间的翻译转换,只要这两个难点突破了,机器翻译在口译方面的应用要比在文学翻译方面的应用要简单得多,其收益是不可小觑的,可以说是蕴藏着巨大的商机呀!

再者,此流程正好切合释意理论(谭载喜,2004:267),即口译是一个三角过程:“从语言到意思再到语言,而不是单纯地从一种语言到另一种语言的直线过程。语言先被感知(感知階段),接着被归纳出意思(理解阶段),最后用另一种语言形式表达出来(表达阶段)。”按理来说是可行的。

1.软件宏观设计

先将声音用现有的语音识别器IBM viavoice转化成甲种文字,然后通过翻译软件Systran或Trados翻译转化成乙种文字,最后将转化后的文字再用文字播放器播放出来,具体的宏观步骤如下图所示:

2.软件微观设计

对于Systran 和Trados的设计,划分句子成分很重要,可如下图来实现,像对我们有用的英汉翻译,在划分句子成分以后,主句作一句来译,从句则根据句子情况,有的独立成句,有的作为修饰语来翻译,作为修饰语的根据其属于定语、状语还是补语,不同成分按照状语,定语、主语、谓语,宾语的顺序加以组合成句,以增加机器翻译句子的流畅性和可读性。

罗杰·贝尔(廖七一,2000:127)对于翻译曾有过相应的论述,上图只是将其语义分析器的设计进一步拓展,以便机器翻译的操作性更强。上图中只列出了定语从句中的主语、谓语和宾语各由那些词组成,其他句型的主语、谓语和宾语,因为与一样,后面的就没有重复列举。

我们不仅对语言中的词汇进行分类,在组合成句子的过程中分别将各种词放在各自的位置上,然后加以连接,已变成符合表达习惯文字和句子。

对于独立成句的,我们这样排列句子顺序,时间状语从句,地点状语从句、定语从句,主句,宾语从句,如此,可以增加句子的可读性。

四、软件开发存在的困难

1.口译自身问题

当然,由于机器翻译需要一定的反应时间,将机器翻译用于口译还有许多难题需要克服,将其用于交替传译的可能性比较大,因为交替传译的停顿,肯定是一个完整的句子或句群,计算机有时间对整个句子进行语料匹配和分析,等发言人停顿时,计算机可以根据其语言信息将意思用另一种语言传递出。而语同声传译则需要发言人说完第一个句子后,计算机通过对此句子的分析和转换,通过处理再翻译出来,虽然计算机的处理速度很快,但由于程序繁杂,计算机可能还是需要几秒的时间才能翻译出来。还有,由于计算机无法与前面出现的信息进行互动,翻译出来难免有些生硬。

2.软件庞大,电脑反应速度不够

由于软件更加庞大,现在的电脑,仅仅是安装Systran 和Trados软件,电脑的处理速度就急剧下降,再加上前后两个软件,反应速度更是可想而知。

总 结

一方面,现在国家在口译方面的投入是比较大的,如果能开发出一种软件来替代人工劳动,不仅节省了国家在這方面的开支,也可使许多人免于做口译的折磨,这无疑是一件很好的事。如果成功的话,将来就会有这样的一天:领导出访,商业谈判,涉外法庭宣判等都不用带口译员,只需带一个口译软件即可,到时人们在国际间旅游,就不需要支付昂贵的导游费用了,我们只需带一个装有口译软件的智能手机就可以了;对于这样美好的憧憬,实在是特别的诱人。

另一方面,由于软件庞大,要实现口译的机械化还有软件方面的许多技术性难关需要克服,软件开发变成现实还有很长的路要走;不过,就让后来者在努力中拭目以待,期待这样的日子早日进入人们的生活!

参考文献:

[1]谭载喜.(2004).西方翻译简史.北京:商务印书馆.

[2]冯志伟.机器翻译—从梦想到现实[J].中国翻译1999(5).

[3]廖七一.(2000).当代英国翻译理论[M].武汉:湖北教育出版社.

猜你喜欢
机器翻译口译
中外口译研究对比分析
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
EAP视听说对英语口译关联迁移的增效性——以交替传译为例
浅谈口译教学中的译前准备与百科知识积累——以口译教学中的科技主题为例
论心理认知与口译记忆
英语专业口译教学改革初探