陶瓷英汉双语平行语料库的创建与应用

2023-08-04 02:07刘嘉茜
江苏陶瓷 2023年3期
关键词:双语陶瓷

刘嘉茜

摘要本文将以语料库翻译学为指导,探讨以陶瓷为核心的英汉双语平行语料库的创建与应用,详细阐述语料库的整体设计思路与具体研制步骤,以及语料库在陶瓷语言特点研究、课堂教学、陶瓷术语库构建等方面的实际应用。希望通过这种新的研究范式,提升陶瓷翻译的质量及效率,推动陶瓷文化的国际传播。

关键词  陶瓷;平行语料库;双语

0引言

中国因陶瓷而闻名,在中国文化史上,陶瓷是一种独特而重要的载体,然而许多中国陶瓷中的基本概念,在不同文化背景下有着不同的理解,这导致陶瓷英译存在一定困难。例如,“青”为陶瓷典籍的核心概念之一,关于“青”的表达有青绿、粉青、霁青、青瓷、青花、青白、头青等等,英译时应需根据语境和陶瓷专业知识,具体辨析“青”的内涵和用法,采取相应的翻译策略。近年来,国内外关于双语语料库尤其是平行语料库的创建与应用研究蓬勃发展,但迄今为止,专门为陶瓷翻译研究而创建的平行语料库寥寥可数,陶瓷英汉双语平行语料库(以下简称陶瓷语料库)不仅能用于陶瓷语言研究,还能在翻译中帮助译者“理解和掌握同一领域中不同语言的常用术语、惯用表达式、文章语气及典型的语篇结构,避免在专业翻译中经常出现的语言‘不自然或‘形似而神不似的现象”。此外,陶瓷语料库还将为课堂教学、词典编纂、术语库构建提供平台,具有广阔的应用前景。

1陶瓷语料库构建的必要性

目前陶瓷翻译研究中主要存在以下问题:(1)术语的一词多译,如“三彩”可译为“Sancai”“Tricolor”“tri-color”“Three-color”“tri-colored glazed”等。术语译文的不统一将增大外国读者的阅读难度,也不利于中国陶瓷文化的传播;(2)专业知识匮乏,如“鸡首壶”译为“chicken-head-shaped ewer”,但“鸡首壶”并不是整个壶(ewer)像鸡首,只是壶嘴(spout)像鸡首而已,应改译为“Celadon ewer with chicken-head-shaped spout”。陶瓷文本的英译需要译者具备充分的陶瓷专业知识,原文与译文的机械对等可能导致歧义;(3)中西方文化差异,如龙是陶瓷上常见的装饰纹样,但中西方文化中的龙是完全不同的。在西方文化中,龙是代表贪婪与破坏的邪恶象征。而在中国文化中,龙被认为是创造世界的四大神兽之一。在封建时代,龙也被看作是帝王的象征,因此将龙直译为“dragon”是不准确的,也会造成歧义,不妨音译为“Long”,“这一处理在最大程度上保留了中国特色术语概念的原生性”。

陶瓷语料库的构建将为解决上述问题提供很好的参照。首先,通过创建陶瓷语料库获得较为完善和齐全的陶瓷双语语料,可以在比较并分析大量语料的基础上构建陶瓷术语库,解决陶瓷术语译名不统一、乱译、错译的问题;其次,平行语料库中的两种语言互为对应,记载着两种语言中的对应词和对应单位,成为词典编纂者最可靠的数据来源;再者,在辅助教学方面,平行语料库也能为课堂提供丰富的案例与上下文语境,通过对语料的加工还能够提供词汇的搭配情况、频率、反向检索等数据。综上,创建关于陶瓷语料库可以极大提高陶瓷类文本的翻译效率,并且有双向的中英文语料作为参照,译文能做到准确传达原文信息的同时,可读性也大大增强。

2陶瓷语料库的设计与构建

2.1语料库的设计

语料库的整体设计是语料库研究和應用的关键,Sinclair认为语料库如何选材、如何架构往往决定了语料库的后续发展,甚至决定了能获取什么样的研究成果。就性质而言,陶瓷语料库属于专用(specialized)、同质的(homogeneous)语料库,只收集与陶瓷相关的中英文原生性的文本及其译文。不同于通用型语料库,专用语料库通常是为满足使用者特定的研究需求而创建的。陶瓷语料库的研究用途主要有两点:一是陶瓷翻译研究,二是陶瓷语言研究。其中,针对翻译研究而采集的语料为双向(bi-directional)的平行语料,即英译汉的语料和汉译英的语料。针对语言研究所收集的类比语料则分为英语原创语言、英语翻译语言、汉语原创语言、汉语翻译语言四类。将平行语料与类比语料相结合,能在语料库的翻译研究中发挥更大的增效作用。

2.2语料收集与降噪

原始语料的选择是语料库建设过程中的一个重要问题,我们结合陶瓷语料库的研制目的,制订出以下几条标准:(1)类型丰富,为适用于不同类型的陶瓷翻译研究,我们将尽可能采集多样化的语料,包含陶瓷的典籍、通用书籍、图册、手册等,本研究旨在尽可能覆盖陶瓷文本的全部类型,但并不单纯追求语料库规模的庞大。(2)学术性高,文本撰写者须为国内外陶瓷学界的著名学者,且英汉均为已出版的书籍。(3)时间分布合理,为便于开展历时的语言变化研究及语言与翻译的关系研究,我们也将注意语料的出版时间。(4)双向语料,中英文互译的双向语料可实现原文与译文的比较,也可实现译文与非译文的比较,能够最大限度地利用语料库。鉴于以上标准,我们首批采集的语料约48万字、词,其中英语语料274 447词,汉语语料210 372字,时间跨度为1897-2011年。

语料的具体收集步骤如下:首先,对纸质文本进行扫描,并使用OCR文字识别软件导出成可编辑的Word格式文本。将文本中配图及图注单独编号存储后,清洗掉无关的、错误的信息及符号,再使用Word软件中的“查找-替换”功能,对多余空格、段落空行、软回车或硬回车等进行降噪,尽量消除文本噪音,才能满足精确检索的要求。由于文本类型众多,我们要求语料文本格式一致、文件名规范,将原文与译文使用同一文件名存储,但使用不同前缀,例如:ch-中国外销瓷、en-中国外销瓷。此外,单词拼写错误须人工校对,校对无误后存储为纯文本(plain text)格式,也就是后缀为“.txt”的记事本文件,这是语料最常用也最简便的存储方式,几乎所有检索软件都能加载并读取此类文本数据。

2.3语料的分词与标注

为便于后期进行更深层次的研究,我们将对中英文语料分词及标注。中文语料使用中科院研发的软件ICTLAS进行分词和标注,英文语料使用软件CLAWS进行标注。通过检索标注后的文本,可以对文本进行词汇层面或句子层面的考察。例如,计算词汇密度即实词与总词数比值的百分比。在句子层面,通过检索特定的正则表达式(regular expression)可专门研究某一特定句型在陶瓷文本中的使用,这些检索结果不仅能够帮助我们分析陶瓷文本中专有的语言特点,也能为英汉陶瓷文本对比提供数据。

当我们使用一个语料样本时,我们需要知道与这个样本相关的作者、出版时间、标题等数据,这类信息称为篇头(HEAD)。陶瓷语料库的篇头元信息包含:中英文标题、作者、译者、翻译方向、年代、出版信息、文本字数。

2.4语料的对齐

语料的对齐一般分为:段对齐、句对齐和段对齐下的句对齐。由于本语料库的研究目的之一为陶瓷翻译研究,因此采用句级对齐。使用对齐软件对所有中英文语料进行对齐,但由于英汉语言的差异,实际翻译中可能出现一对一、一对多、多对一、多对多等情况。因此,在完成机器对齐后仍须人工校对,图1为已对齐的中英文语料。对齐后的语料有两种存储方式:纯文本格式与TMX格式。纯文本格式最大的好处是占用空间小、存取方便,而且几乎所有操作系统都能处理。TMX格式可直接在翻译辅助平台上直接作为平行语料库供查询和检索。

3陶瓷语料库的应用

3.1陶瓷语言特点研究

根据已建成的陶瓷语料库,可以通过检索和分析

来研究陶瓷文本语言本身的特点,例如高频词,高频词是指在某一文本中出现频率特别高的词语,可通过该词在全文中所占百分比或该词在词频中所处的前后位置来确定。我们使用软件AntConc分别统计英语和汉语中出现频率最高的前十五个词语,如表1所示。

根据表1得出结论如下:(1)虚词的频率远高于实词,这一点无论在英语还是汉语中都是一样的,所不同的是虚词的种类。(2)所属关系的表达方式,汉语词语中出现频率最高的是“的”,“的”常用来表达代词或名词的属格关系(如“我的”“瓷器的”),而在英语中除了通过代词属格的变化(如you和your),还可以通过名词之间加of的形式来表达,所以of也是英语中出现频率第二高的单词。(3)介词的差异,汉语中的“在”与“上”“中”搭配使用适用于多种场合,但英语中的介词一般都有较特定的用法。(4)汉语高频词中,“釉”“窑”“瓷器”“纹”“器”都是与陶瓷密切相关的词语,具有明显的陶瓷文本特点。但英语中前十五个高频词并没有明显具有陶瓷特色的词语。除高频词外,我们还能研究陶瓷文本在语篇、修辞、词汇、常用术语、惯用表达式等方面与普通语言不同的特点。

3.2辅助课堂教学

传统的翻译教学课堂是以“教师+教材”为中心,而将陶瓷语料库应用于课堂教学进行数据驱动式学习(data-driven learning,简称DDL),实现以“学生+案例”为中心的翻译教学。陶瓷语料库将为陶瓷翻译教学提供大量英汉对齐的电子文本,并“辅以计算机统计手段”,通过“观摩、对比、分析、借鉴的方式”来培养学生的翻译意识。例如,使用中国传媒大学研发的检索软件CUC_ParaConc,以“瓷”为关键词对已完成对齐的文本进行检索,共检索到3 901处,其中porcelain826处、wares738处、ware411处、ceramics388处、ceramic164处。语料库可以对某一检索词或术语提供丰富的双语对译案例,帮助学生进行对比分析,提高学生翻译的意识和应变能力。双语平行语料库在翻译教学中的作用是教科书所不能替代的,并且具有广阔的使用前景与潜在的开发价值。

3.3建立陶瓷术语库

作为中国特色传统术语之一,陶瓷术语“源自中华民族发展的不同历史时期,涉及科技、人文及社会实践等诸多领域”。作为陶瓷文化的核心,术语的应用与传播具有“重复性”特征,对其进行“统一规定”非常必要,因此我们将在已建成的语料库基础上制作陶瓷术语库。在SDL MultiTerm Extract中導入已对齐的翻译记忆库,点击Term Properties框对术语进行依次修改和筛选,确认无误后保存。确认和添加完所有的术语对后将术语库导出。目前,我们已构建了陶瓷款识术语库,其中收集了400对款识及其译文,并标注款识的类型、翻译方法等信息。

话语传播,术语先行。中国特色术语翻译标准化是中国特色话语有效对外传播的前提与基础。伴随着陶瓷语料库的不断更新,我们也将不断完善陶瓷术语库,为陶瓷术语的统一提供标准,增强陶瓷文化对外传播的科学性和严谨性。

4结语

本文主要探讨了陶瓷英汉双语平行语料库的具体构建步骤,并对中英文陶瓷语言特点、课堂教学应用以及陶瓷术语库构建做了详细阐述。在未来的研究中,我们会将平行语料与计算机辅助翻译记忆库结合,进一步提升陶瓷翻译的质量及效率,以促进陶瓷文化的传播。目前陶瓷语料库只是初步建成,后期也会将语言种类扩展,补充其他语种的语料,将其构建成以中文为核心的多语言陶瓷语料库。希望通过翻译这一媒介,能够将中国瓷器的辉煌成就弘扬世界,也能向世界展示中国形象,促进文明交流互鉴,提高国际话语权。

参考文献

[1]卢军羽.中国陶瓷典籍中“青”的内涵源流及英译[J].中国翻译,2016,37(04):105-109.

[2]李德超,王克非.新型双语旅游语料库的研制和应用[J].现代外语,2010,33(01):46-54.

[3]陈蓉.从术语库到语料库——陶瓷术语“三彩”的译名研究[J].陶瓷研究,2021,36(04):4-7.

[4]欧飞兵.陶瓷文化术语对外传播及翻译标准化[J].景德镇学院学报,2022,37(05):114-118.

[5]魏向清,杨平.中国特色话语对外传播与术语翻译标准化[J].中国翻译,2019,40(01):91-97.

[6]王克非.中国英汉平行语料库的设计与研制[J].中国外语,2012,9(06):23-27.

[7]Sinclair,John. Council of Europe Multilingual Lexicography Project [R].Report submitted to the Council of Europe under contract no.57/89,1991.

[8]黄昌宁.语料库语言学[M].北京:商务印书馆,2002.

[9]秦洪武.双语语料库的研制与应用[M].北京:外语教学与研究出版社,2021.

[10]王朝晖,余军.韩素音国际翻译大赛语料库构建及翻译教学应用[J].中国翻译,2019,40(05):72-79.

[11]冯庆华.思维模式下的译文词汇[M].上海:上海外语教育出版社,2012.

[12]王克非.语料库翻译学探索[M].上海:上海交通大学出版社,2012.

猜你喜欢
双语陶瓷
漂亮的陶瓷彩绘
金意陶陶瓷
载歌载舞话陶瓷——瓷之舞
陶瓷艺术作品
双语让人更聪明
德化陶瓷 闽中精粹
快乐双语
快乐双语
快乐双语
陶瓷鉴赏