机器翻译与人工翻译的比较

2021-12-21 02:30宁静
名作欣赏·学术版 2021年12期
关键词:质量评估机器翻译

摘 要:神经网络翻译技术(NMT)将翻译带入了一个新纪元。其中,谷歌翻译系统是当今机器翻译的典型代表之一。本研究以《黄帝内经》中的术语翻译为例,人工翻译以吴连胜、吴奇的《黄帝内经(英汉对照)》为译本,翻译质量评估以《黄帝内经注解集》为参考,对比了谷歌机器翻译和人工翻译在一般术语、经络名称、数字名称三方面的译文质量,以期为机器翻译系统的术语管理提供语言分析的证据,以促进对机器翻译和人工翻译关系的理性思考。

关键词:机器翻译,人工翻译,中医术语,质量评估

一、引言

如今,机器翻译和计算机辅助翻译的理论已经得到了翻译界诸多学者的认可,他们认为基于规则的机器翻译具有更高的准确性,且统计机器翻译的成本较低(蔡舒等,2009)。专业译员需要处理不同领域的专业问题,机器翻译有助于提高效率、节省时间。然而,这些系统尚不完善,在翻译某些特定领域时,翻译质量会下降(Wolk & Glinkowski,2015)。鉴于此,本研究以《黄帝内经》 中的术语为例,对比谷歌翻译和人工翻译在一般术语、经络名称、数字名称三方面译文质量进行比较。

二、材料来源

(一)术语选择的标准

本研究选取了《黄帝内经》中的三类具有代表性的中医术语(吴连胜、吴奇,1997)。第一类是通用术语,包括“天癸、养生、腠理”;第二类是经络名称,例如“冲脉”;第三类是有关数字的术语,包括“五藏、十二节、九窍”。这些术语在它们所属的特定学科中起着重要的作用,而这些蕴含着中医精髓的术语,大部分在《黄帝内经》中首次出现,因此精准的翻译对中华医学的国际传播至关重要。

(二)人工翻译的选择

在《黄帝内经》中,同一中医术语有两个或多个译名,不同的译者有各自的语言特征。即使是同一个译者对同一个单词的翻译也会根据语境的不同而有所不同。为了保证翻译的权威性,本研究选择了在第三届世界传统医学大会上获得金奖荣誉的吴连生、吴奇的译本,其翻译符合简单、忠实、民族性等原则。

三、质量评估方法

(一)人工评估

2000年以后,自动评估系统逐渐受到关注,它在处理大量数据时比人工评估效率更高,但在对复杂语言系统进行评估时的表现难免不尽如人意;人工评估能保证准确度,但人力成本高(贺文照、李德凤,2019)。所以面对中医文化这一复杂的概念系统,利用专业评估人员的知识储备、语言能力、上下文语境判断等多方面素养来评估翻译质量,更为适宜。因此,在本研究中,谷歌翻译的机器翻译质量由人进行评估,因为《黄帝内经》中的中医术语具有模糊性和隐喻等自然语言特征,其文体是古典汉语,而现代的普遍文体是口语化。

(二)评估标准

无论是根据1964年美国ALPAC(自动语言处理咨询委员会)报告中规定的《机器翻译人工评估标准》,还是根据《机器翻译人工评估指标》,机器翻译的评估标准主要还是忠实性和流畅性。忠实性是指机器翻译是否忠实于原文,流畅性是指翻译是否表达流畅、符合受众表达习惯。本研究把人工翻译中接受度较高的吴连生和吴奇的翻译作为对比文本,此外,在分析原文的含义时,还参考了《黄帝内经注解集》(龙伯坚、龙式昭,2004),有助于准确理解原文的内涵。

四、评估结果分析

(一)一般术语翻译分析

“天癸”是指由富肾能量所产生的物质,促进人体生殖器官成熟,维持生殖功能。“天”意思是天生的;“癸”的意思是它属于天干的簋水,是阳中的阴(龙伯坚、龙式昭,2004)。这个术语首次出现在《黄帝内经·平常话》中,谷歌将这个词翻译成“Tian Gui”。显然,它可以识别这个词是一种特定的术语,所以这个词被大写。然而,这个词被分成两个词。这表明谷歌不知道这个词指的是什么,所以它没有把这个词作为一个整体,而是以翻译人名的方式翻译了这个词。因此,谷歌的翻译未能达到忠实。这是因为机器翻译只能按照人类编写的程序进行操作,因此它不能在数据库之外进行自己的逻辑推理和判断。如果原始词汇超出语料库范围,机器翻译系统将产生错误的翻译。吴连胜、吴奇将这个词翻译成“Taingui”,而没有把这个词完全翻译成与汉语拼音“Tiangui”相同的词,而是根据英文拼写和音标原则,翻译成“Taingui”。所以毫无疑问,吴连胜、吴奇的版本比谷歌的版本要合适。

“养生”是指通过多种方法维持生命、增强体质、预防疾病,从而达到长寿的一系列医疗活动。谷歌将这个词翻译成“Health”。虽然这个词是中国传统医学和道教中的哲学概念,但在现代被广泛传播和使用,没有必要大写这个词。此外单凭“Health”一词并不能完全表達该词的原意,因为读者只知道它与健康有关。“养生”作为中华传统文化的概念,仅凭字面的理解,而不结合文化内涵,无法获得正确的翻译。吴将这个词翻译成“preserving one’s health”,是忠实和简洁的。

“腠理”是指皮肤或肌肉上的小凹槽,谷歌翻译将其译成“Management”。这个翻译是完全错误的。它只关注“理”字,并将其翻译成“Management”,吴将这个词翻译成“striae of skin”。这一次,吴的翻译并不完美。具体来说,“腠”指的是人肌肉上的微小凹槽,而“理”一词指的是皮肤上的小凹槽。从整体上看,它应该被翻译成“striae of muscles and skin”。

(二)经络名称翻译分析

经络名称,机器翻译也出现了类似的错误,所以我们只详细分析其中的一个术语。“冲脉”指的是八大经络之一。谷歌翻译“冲”这个词为“red”。 在中文词典,“冲”字没有红色的意思。那为什么机器会把它变成红色呢?从“冲脉”的定义来看,它调节了十二个通道的气和血。众所周知,人的血液是红色的,所以也许机器翻译将“冲”一词与血液的颜色关联。但人工翻译中将“冲脉”译为“Chong channel”,充分考虑到了术语的一致性。因为在书中,所有的八脉均采用音译的方法,所以将“冲脉”译为“Chong channel”更为恰当。

(三)数字名称术语翻译分析

第三类术语是数字名称的术语,机器翻译仍侧重于字面水平,从而产生错误的结果。值得注意的是,第三类的术语具有深刻的含义,也就是说,其中一些是许多不同事物的通用名称,如“五藏”和“九窍”,因此它们需要在一般情况下加以解释。另外,双关语“十二节”,在原文中既指十二节气,也指十二道。显然,机器是不可能理解这两层含义的。

五、结语

机器翻译研究的发展提高了机器翻译的效果,但仍面临着双语数据缺乏、语言特征指标不完善等困难,翻译质量还不尽如人意。机器翻译本质上是一个语言问题,因此,我们应优先加强语言对比研究,总结人工翻译的经验,规范机器可读词典(屈亚媛、周玉梅,2016)。在具体专业领域,通过人工测评提高机器可读词典质量,从而提高机器翻译的质量(罗季美、李梅,2012)。本文对谷歌神经机器翻译系统在传统医学术语翻译中的质量进行了评估,并与吴连胜、吴奇的英文翻译进行了比较,为制作相关中医术语体系提供了借鉴,也为未来编制机器可读词典,从而提高机器翻译的准确性和适宜性指明了方向。

参考文献:

[1]蔡舒,吕雅娟,刘群. 人工书写翻译模板在统计机器翻译系统中的应用[P].第五届全国机器翻译研讨会,2009.

[2]Wo?k, K., Marasek, K., & Glinkowski, W. Telemedicine as A Special Case of Machine Translation [J]. Computerized Medical Imaging & Graphics, 2015.

[3]吴连胜,吴奇. 黄帝内经(英汉对照)[M]. 北京:中国科学技术出版社,1997.

[4]贺文照,李德凤. 英语关系从句机译汉语评价——以谷歌机器翻译为例[J].中国科技翻译, 2019, 32(3).

[5]龙伯坚,龙式昭.黄帝内经集解·素问[M].天津:天津科学技术出版社,2004.

[6]屈亚媛,周玉梅. 机器翻译还是人工翻译?——浅析《黄帝内经·素問》双字格养生术语机译错误人工评测[J]. 医学争鸣, 2016, 7(4).

[7]罗季美,李梅. 机器翻译译文错误分析[J].中国翻译,2012(5).

基金项目: 本文系2020年度广东省普通高校青年创新人才项目(编号:2020WQNCX008)研究成果; 2020广东省高等教育教学研究南方医科大学项目(编号:JG2020032)研究成果

作 者: 宁静,南方医科大学外国语学院讲师,研究方向:医学翻译。

编 辑: 曹晓花?E-mail:erbantou2008@163.com

猜你喜欢
质量评估机器翻译
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
基于组合分类算法的源代码注释质量评估方法
大数据背景下石油科技翻译
大数据背景下石油科技翻译
机器翻译不可盲取
基于免费在线翻译工具的机器翻译缺陷探讨
汉哈机器翻译中的文字转换技术研究
澳大利亚研究生课程的外部质量评估
植物生产类专业卓越农业人才培养质量评估体系的构建