汉英自动翻译中一些常见问题的探讨

2017-12-14 07:00张为为
校园英语·中旬 2017年12期
关键词:冠词汉英介词

张为为

引言

机器翻译又称自动翻译,是利用计算机来进行的语言之间的转换,它是自然语言处理的一个分支,与计算语言学、自然语言理解之间存在着密不可分的关系。它是横跨语言学、数学、计算机科学、翻译学及人工智能等的综合学科,也是信息时代语言应用的一个重要领域。

一、机器翻译的历史和必要性

1.机器翻译的历史。20世纪30年代初,法国科学家 G.B.阿尔楚尼提出了用机器来进行语言翻译的想法。随着科技的进步,1946年人类第一台现代电子计算机ENIAC诞生,1949年,韦弗(W. Weaver)在其发表的《翻译备忘录》中,正式提出了机器翻译的思想。中国机器翻译研究开始起步于1957年,是世界上第四个开始搞机器翻译的国家。80年代中期以后,中国机器翻译研究发展进一步加快。90年代初KY-1 和MT/EC863两个机译系统的研制成功,表明中国在机器翻译技术方面取得了历史性突破,随着互联网的普及和人们对翻译需求的迅猛增长,机器翻译又迎来新的发展机遇,我国相继推出了一系列在线翻译系统

2.机器翻译的必要性。同人工翻译相比,机器翻译有很多优势。首先,存储容量大。存储100万个词条对计算机来说是一件轻而易举的事情,这是人的大脑无法企及的。其次,翻译速度快。机器的翻译速度是人工翻译速度的几十倍,乃至上百倍。再次,更加经济和节省劳动力。据戴尔电脑制造商韦恩·波兰德说,他的公司网站需要提供28种语言,机器翻译已经为其节省了40%的翻译时间。随着对信息获取速度要求的不断提高和国际间交流的日益频繁,人工翻译的低效率、高成本远远不能满足需要,机器翻译将毋庸置疑地成为必要的辅助翻译工具。

3.机器翻译的主要方法。机器翻译的过程一般可简化为三个阶段:原文分析、原文译文转化和译文生成。表象上,机器翻译的核心问题是翻译的准确性;实质上,体现在技术层面则是机器翻译系统采用的方法论问题。在方法论层面,机器翻译系统可分为基于规则(Rule-Based)和基于语料库(Corpus-Based)两大类。基于规则(Rule-Based)就是由词典和语法规则库构成翻译知识库。基于语料库(Corpus-Based)则是以语料的应用为核心,由经过划分并具有标注的语料库构成知识库。语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。

二、汉英机器翻译中常见错误分析

汉英机器翻译中,汉语到英语的转换实际上是一个信息增加的过程。在汉语中所没有的各种形态信息,如单复数、时态、语态等等,在转换和生成中都必须添加上去与过去相比,汉英机器翻译译的速度和质量尽管已明显提高,但与人工翻译相比,机译的文本依然会出现许多错误。下面就在汉英机器翻译过程中常见的错误加以举例分析:

1.直译的错误。汉语中一词多义现象非常普遍,一个词在与不同的词语搭配时具有不同的词义。人工翻译会根据语境来选择,而机器翻译还达不到通过语境来判断语义,通常是根据该词的第一个词义来直接翻译,这就容易出现一些选词不当或错误的翻译结果。2.被动语态使用错误。汉英机器翻译中,主动语态和被动语态的转换也是对计算机的一个严峻考验,因为汉语句子中并没有相应的语法标志,只能根据句子所处的上下文环境和语义及常识进行判断。3.冠词使用错误。汉语没有冠词,在英语的名词短语中却往往要加上冠词,这其中又分为零冠词、定冠词和不定冠词三种情况。同时,英语中的冠词有时候相当于汉语中的指示代詞“这”、“那”、“该”等。因此,如何把握就成了机器翻译的难题,就会出现表达不当的情况。4.介词及其搭配使用错误。据统计,汉语中总共有介词30个左右,英语中有介词286个,其中在一百个英语句子里几个常用的介词如at,in,on和for的重复出现率为二、三百之多。英语介词不但多,而且使用范围广,所以机器翻译起来往往错误百出。5.句法结构的错误。英语重形合,汉语重意合。所谓“形合”是指语言的词语、分句以及句子之间借助语 言形式手段(如关联词)实现词语或句子的连接,表达语法意义和逻辑意义。

三、几点建议

1.正确使用机器翻译。机器翻译发展经历了不同阶段,从开始只能翻译简单的句子,到现在翻译整篇的文章,已有了巨大的发展,在处理专业性强、数量大的技术资料和论文等有相当的优势。随着新机器翻译系统的开发,人工译员不再只是听机器的指令,而是以一种与人工翻译决策过程类似的方式来指引翻译过程。但是,无论用多么复杂的技术制造出来的产品均不能与人类大脑的创造天赋相比。人工译员介入改善翻译文本仍然相当重要。因此,我们应根据自己的实际需求,客观确定机器翻译译文质量的接受值,机器翻译的结果也不能作为最终数据直接用于科研学术研究。

2.建立功能更加完善的语料库。汉英机器翻译处理的是语言问题,处理语言问题就不应该离开语言知识的辅助,机器翻译时所需要的主要信息是一个大型的双语语料库,若是输入的东西数据库里没有,机器就翻不出人们想要的结果。语言学家经过长期努力创建了含有成千上万条规则的语料库,覆盖了多样的语言现象,但是,如今信息的日新月异导致现实中的语言现象复杂多变,涉及到词法、句法理论以及语用理论等。翻译这些语料不仅需要扎实的语言功底,而且还需要有广阔的文化和百科知识,甚至需要有很高程度的新学科领域的专门知识。作者认为目前的语料库已无法满足汉英机器翻译的需求,这就导致汉英机器翻译中诸多问题的出现。因此,从根本上还要依靠语言学家和每位语言爱好者更加深入细致的研究工作,投入更大的人力和物力,建立一个功能更加完善的语料库,这样可以大大提高机器翻译的正确率及可读性。

猜你喜欢
冠词汉英介词
冠词(一)
介词和介词短语
有无冠词 意义大不同
冠词讲与练
话题链在汉英篇章翻译中的统摄作用
从目的论看环保公示语的汉英翻译
汉英文字的幽默修辞功能浅探
冠词缺失与中介语句法损伤研究
汉英机器翻译中的意译和直译应用
看图填写介词