商务英语合同的语义范畴与词性分布特征的语料库考察

2017-05-10 12:54王立非文道荣
山东外语教学 2017年2期
关键词:词频范畴语料库

王立非, 文道荣

(对外经济贸易大学 英语学院, 北京 100029)

商务英语合同的语义范畴与词性分布特征的语料库考察

王立非, 文道荣

(对外经济贸易大学 英语学院, 北京 100029)

本文运用Wmatrix工具对我国EPC工程合同语料进行语义和词性特征标注,与BNC语料对比,考察商务法律语篇的语义范畴、词性和词频的分布特点。研究发现:1)就语义范畴而言,EPC合同文本最高频的语义范畴是I2.1: Business: Generally(商务:普通)和Q1.2: Paper documents and writing(书面文档与写作),EPC合同文本首先是一种具有法律属性的商务文本;2)就词性特征而言,EPC合同文本多用NP1(专有名词单数)、NN1(普通名词单数)、ZZ1(字母顺序词)以及冠词、指示代词和物主代词等,说明EPC合同文本并非普通商务协议,而是一种高度规范化和法律明晰化的商务合同文本。本研究对商务英语写作、商务英语阅读和商务翻译教学具有启示。

商务合同;语义范畴;词性;语料库分析

1.0 引言

ESP研究在我国始于1970年代,涉及医学、法律、金融、贸易、旅游、新闻、外交、体育、计算机、工程、石油、电力、航空、军事等多个领域。近年来,专用语言学科发展势头强劲,出现了商务语言、法律语言、传媒语言、政治语言、计算语言、民族语言、生态语言、医学语言、军事语言、外交语言、体育语言、航空语言等跨学科领域,ESP理论体系和研究方法正在逐步走向完善。

商务法律合同研究是商务语言研究的一个重要领域,对中国企业“走出去”和对外工程承包具有重要价值。当前我国关于EPC合同的法律规定较为分散,合同法和建设工程法律法规不能完全适用于EPC合同,经常因合同文本的不同理解引起大量合同纠纷,因此,对EPC合同进行研究具有现实性和迫切性。EPC工程总承包合同(Engineering and Procurement Contract以下简称“EPC合同”)是发包人和承包人签署的由承包人全面履行工程设计、采购和施工义务并最终交付合同标的物、发包人支付相应价款的合同,在全球商务活动中具有举足轻重的作用。中国企业“走出去”的一些大项目大多采用了国际咨询工程师联合会(FIDIC)编写的《EPC/交钥匙项目合同条件》。本文研究EPC合同文本,以便为中国企业EPC英文合同撰写与解释提供新的视角,同时期待能够有助于商务合同文本的理解、促进商务英语的教学,并能够服务于商务翻译实践,为中国企业“走出去”提供启示。

2.0 研究现状

2.1 法律合同语言研究

法律语言研究受到越来越多学者的关注,法律与语言都是一种规范性存在,都是一种规范性的社会现象。由于法律与语言、法学与语言学之间存在相似性和紧密联系,使得两者在共同关注的一些问题上把法学和语言学结合起来,相互借鉴各自的理论与方法,使得开展交叉研究成为可能。国内论文注重法律翻译研究和法律英语教学(张明杰,2015;王贵芳、余卫华,2015;穆可娟,2015;张英、赵以,2015等)。国外论文注重对法律语言进行语篇分析,法律语用研究和法律语义研究也是热点领域(Mertz,1994;Tiersma,2006; Petroski,2015)。在研究方法上,实证研究方法呈上升趋势。

而其中,法律语用学研究非常显著, 主要研究在法律语境中法律语言使用者运用法律语言表达的话语意义, 同时研究特定语境场合下特定的法律话语。立法者要具有相关专业的背景知识,以科学的态度立法,避免错误预设的误导。法律语言学作为新兴边缘学科,研究内容具有丰富性,研究角度具有多维性,研究方法具有多样性(吴树勤,2006)。比如,语境在法律解释中的重要性(郭贵春、刘俊香,2000); 法律人专业语境与非法律人日常语境的存在差异化和有罪预设的语言问题经常发生且不易发觉(杨年保,2005); 合同语言讲求严谨但又不过于严密(吴树勤,2006); 法律条款语言预设会产生积极或消极效果(李妮,2006)。此外,法律解释要充分考虑立法历史背景(张新红,2000)。法律语言的专业化提升权威性,法律语言的大众化扩大普法率, 寻求权威性与普法率的平衡; 建议我国法律明确赋予犯罪嫌疑人沉默权,以解决有罪预设语言之泛滥。

合同语言的审核要结合合同种类,尤其注意EPC合同存在索赔时,语言预设要有谈判余地; 而具体到EPC,其通常被作为法律文本进行的研究目前主要是从宏观或凭经验的方法对其进行文体特征的分析(余清萍,2006;刘俊,2008;程红军,2009;王谦,2009;刘芙蓉、韦薇,2013)。总之,法律语言从宏观层面研究成果颇丰,但是从微观层面对法律合同文本的研究严重欠缺,这也正是现实中急需解决的实务问题。目前尚未从语料库角度对EPC合同文本进行深入全面的研究,更没有使用Wmatrix对其进行语义范畴与词性分布特征的研究成果。

2.2 基于语料库的语义研究

本研究所采用的Wmatrix系统由英国兰开斯特大学Paul Rayson博士研制。Wmatrix是一个在线语料分析与对比系统,能实现在线词性标注、语法标注以及语义标注(POS,Grammatical & Semantic annotation),能提供语料词频统计数据和进行关键词索引(KWIC concordance),生成词表及关键词表(Word List,Keyword List),还能提供统计工具(包括对数似然率Log Likelihood, 简称LL)。Wmatrix优于其他软件的独特之处在于其内嵌的工具USAS( UCREL Semantic Annotation System)可自动为文本进行语义域(semantic domain /field)赋码( Rayson,2008;孙亚,2012)。USAS的语义域赋码集(semantic tagset)以《朗文多功能分类词典》(Longman Lexicon of Contemporary English)为基础,包括21个语义域,如“情感”、“食物与农业”、“政府与大众”、“建筑与房屋”、“教育”、“时间”等,这些语义域还可细分为232个次语义域并分别标号。例如,语义域E(情感)包括E1(一般情感)、E2(喜欢)、E3(平静与生气)、E4(高兴与悲伤)等6个次语义域。此外,Wmatrix 可将研究语料库与参照语料库对比产生主题语义域(key semantic domain),即与参照语料库相比,在研究语料库中有超常使用频率或过度使用的语义域(孙亚,2012)。

在线语料库工具被广泛应用于许多研究领域,涉及的领域有文学、政治、法律、社会问题、数学、心理学等。肖忠华、戴光荣(2010)和张美芳(2002)等认为,随着经济和社会的发展,语料库工具应用的范围也越来越广,研究领域也不断延伸。目前语料库工具Wmatrix主要应用于考察文本隐喻使用和隐喻甄别情况(孙亚,2012;孙毅,2013)和政治性文本文体特征研究(钱嘉慧,2015;Rayson,2008)以及译本文体研究(左尚君、戴光荣,2014:60-66)。目前,尚未见应用Wmatrix对涉外EPC合同文本进行文体特征的研究。

3.0 研究问题与方法

本文着重回答以下三个问题:

1) EPC合同文本语义范畴(Semantic Categories)分布特征如何?如何解读合同所反映出的语义范畴特征?

2) EPC合同文本词性特征(POS)分布特征如何?如何解读合同所反映出的词性特征?

3) EPC合同文本词频(Word Frequency)分布特征如何?词频分布特征与语义范畴和词性分布特征具有何种关系?

本研究的语料来自中国中材国际股份有限公司的EPC合同,共计272,397词符。本文采用Wmatrix在线语料库工具对典型中国EPC工程合同语篇进行深层次语义特征等标注,实现语料数据自动提取与对比分析,重点关注语义范畴、词性和词频等文体分布特征。本研究对EPC合同进行词性(Part of Speech, POS)标注,是语料库标注的常见形式,并且语料标记的第一代是由UCREL在兰卡斯特大学开发,详见http://ucrel.lancs.ac.uk/claws/。英语词性标注软件CLAWS(the Constituent Likelihood Automatic Word-tagging System),自上世纪80年代初一直在持续开发中。CLAWS4被用于标记达一亿字的英国国家语料库(BNC),目前最新版本是CLAWS8,共有168个词性标识码,对英语文体词性分类更加细化全面,可以实现对语料的深度标识以便于详细的聚类检索。

4.0 研究结果与讨论

本节借助Wmatrix在线语料库分析工具,对EPC真实文本进行如下方面的标注,即语义范畴标注、词性标注并从语义范畴、词性以及词频等三方面的分布特征与BNC Sampler Written语料进行对比,从而深入分析EPC合同文本的文体特征。

4.1 EPC语义范畴分布特点

根据Wmatrix的语义范畴标记类别,与BNC Sampler Written语料库语义范畴相比较,EPC合同的语义范畴特征见图1和表1。

图1 EPC合同语义云图

从中可以看出,EPC合同文本前十大语义范畴包括I2.1: Business: Generally(商务:普通)、 Q1.2: Paper documents and writing(纸质文件和书写)、T1.1.3: Time: Future(时间:将来)、I3.1: Work and employment: Generally(工作和雇佣:普通)、N5.1+: Entire: maximum (整体:最大限度)、Y1: Science and technology in general(一般科学与技术)、T2-: Time: Ending (时间:结束)、I1.3: Money: Cost and price(钱财:价格)、Z5: Grammatical Bin(功能词)、S7.4+: Allowed (允许)等。

表1 EPC合同语义范畴列表

这里分别以语义范畴I2.1: Business: Generally(商务:普通)、 Q1.2: Paper documents and writing(纸质文件和书写)为例举例说明EPC合同语义范畴特征。

首先,与BNC Sampler Written相比,EPC使用I2.1 (Business: Generally)(922次)的差异非常显著(922:2634;LL=2341.57)。I2.1 (Business: Generally)的使用远远高于英语母语的BNC Sampler Written,说明EPC文本在其语义范畴上,更强调商业主题和商业模式,非常值得重视与研究。例如,与典型的法律文本强调权利义务以及举证责任不同,EPC语义范畴更集中于商业主题contractor(承包商)、cooperation(合作)与public-relations(公共关系);更加集中于商业模式的语义范畴有agents(代理)、subcontract(分包)、company(公司)以及secretarial(文秘服务)等,见表2。

表2 EPC合同I2.1词频列表

其次,以语义范畴Q1.2文档与写作(Paper documents and writing)词频列表为例,见表3。本语料中使用Q1.2(955次)的差异同样非常明显(955:3691;LL=2132.71)。例如文档与写作中出现的高频词有contract(323次),notice和notices(157次), certificate和certificates(140次),documents(129次), letter和 draft共(37次)等,见表3。

表3 EPC合同Q1.2词频列表

基于Newmark(1991)的文本功能分类方法, 即表达型文本、信息型文本、说服型文本。典型商务文本中的商务合同可以对应于表达型文本,商务信函对应于信息型文本,商务广告对应于说服型文本。上述EPC语义范畴分布特征集中于I2.1: Business: Generally(商务:普通)、 Q1.2: Paper documents and writing(书面文档与写作)表明,EPC文本类型虽然与法律文本并不矛盾,但从语义范畴的角度看,EPC合同文本更类似于一种典型商务文本中的商务合同,这更涉及到全球通用商务交际中的写作和文档问题,应当引起极大的关注与研究。

4.2 EPC词性(POS)分布特点

根据Wmatrix的词性标记类别,与BNC Sampler Written语料库相比,EPC合同文本的词性项目特征见图2和表4。前十大词性特征包括VVD: past tense of lexical verb (动词过去式) 、NP1: singular proper name(专业名词单数)、ZZ1:singular letter of the alphabet (英文字母顺序)、NN1:singular common noun (普通名词单数)、AT: article (冠词)、DD: determiner (指示代词)、APPGE: possessive pronoun(形容性物主代词)、VM: modal auxiliary (情态动词)、JJ: general adjective (普通形容词)和CC: Coordinating conjunction (连词)等。

图2 EPC合同文本词性云图

这里以高频词性VVD、NP1、ZZ1和NN1分布特征为例分别进行阐述。首先,本语料中使用VVD(83次)的差异非常明显(83:22749;LL=1041.99)。VVD的使用远远高于BNC Sampler Written,说明中国企业EPC商务合同同时具有一种权利义务明晰化趋势,例如agreed、stated、specified、claimed、listed、approved等等,见表5。其中,listed也具有法律文本列举的特点,类似于负面清单,从某种程度上说,予以对权利义务或标的范围按列表进行清晰的界定,这一明显的VVD分布特征也得到了另一NP1和ZZ1等词性的佐证,见表6和表7。

表5 EPC合同VVD词频与词类

从词性特征NP1: singular proper name(专业名词单数)可以看出,款目次和英文字母顺序次高频出现,比如Sub-Clause出现高达63次,表明EPC文本重列举的特点,见表6和表7。而Sub-Clause_3.5出现23次的原因是,本合同第3章涉及到整个工程的工艺流程和布局,所以被多次回指。

表6 EPC合同NP1词频与词类

在EPC十大词性特征VVD 、NP1、ZZ1、NN1、AT、DD、APPGE、 VM、JJ和CC中,表示确定性含义的词性特征就占了6类,分别是NP1: singular proper name(专业名词单数)、ZZ1:singular letter of the alphabet (英文字母顺序)、NN1:singular common noun (普通名词单数)、AT: article (冠词)、DD: determiner (指示代词)、APPGE: possessive pronoun(形容性物主代词)。这说明了EPC商务合同文本具备注重准确避免模糊的特点。

表7 EPC合同ZZ1字母顺序频率

4.3 EPC关键词词频分布特征

根据Wmatrix的词频统计功能,与BNC Sampler Written语料库相比,EPC合同文本的关键词词频分布特征见图3和表8。前十大关键词从高到低有:Contractor(828次,LL=5554.34)、shall(827次,LL=4513.67)、employer(430次,LL=2679.95)、contract(323次,LL=1891.69)、engineer(299次,LL=1883.03)、the_works(235次,LL=1539.37)、or(754次,LL=1451.50)、any(454次,LL=1255.61)、payment(186次,LL=1069.53)、completion(149次,LL=817.36)等。

图3 关键词词频云图

其中,contractor和employer、contract、engineer、shall、the_works表明承包商与发包商以合同的形式由工程师完成工程目标的商业主题,这与EPC文本的语义范畴特征(Semantic Categories)比较吻合;而高词频关键词or、any、payment以及completion等表明在明确工期内完成明确工程分项内容以取得一定付款的合同内容,这同时也与EPC词性特征(POS)注重准确避免模糊的特点一致。

表8 关键词词频列表

5.0 结论

本文尝试通过语料库分析软件Wmatrix对中国企业EPC合同文本进行语义范畴、词性、关键词频率三个特征的标注和分析。研究结果显示:1)从语义范畴分布特征看,EPC文本集中于I2.1: Business: Generally(商务:普通)、 Q1.2: Paper documents and writing(纸质文件和书写)。这表明,EPC文本类型虽属于法律文本类型,但功能上更接近于典型商务文本中的商务合同;2)从词性(POS)分布特征看,EPC文本十大词性特征中,表示确定性含义的词性特征就占了6类,分别是NP1: singular proper name(专业名词单数)、ZZ1:singular letter of the alphabet (英文字母顺序)、NN1:singular common noun (普通名词单数)、AT: article (冠词)、DD: determiner (指示代词)、APPGE: possessive pronoun(形容性物主代词),说明了EPC商务合同文本具备注重准确避免模糊的特点;3)关键词词频分布特征显示EPC合同的商务属性凸显。本研究提供的启示是,我们不但应从法律或法律语言的角度对EPC文本进行研究,同时还应该从商务合同文本的角度加强对EPC文本的研究,这对商务英语写作、阅读和翻译教学十分重要,应当引起商务英语教师和研究者的关注与重视。

[1] Mertz, E. Legal language: Pragmatics, poetics, and social power[J].AnnualReviewofAnthropology, 1994,23(1):435-455.

[2] Newmark, P.AboutTranslation[M]. Bristol: Multilingual Matters, 1991.

[3] Petroski, K.LegalFictionsandtheLimitsofLegalLanguage[M]. New York: Springer International Publishing, 2015.

[4] Rayson, P. From key words to key semantic domains[J].InternationalJournalofCorpusLinguistics, 2008,(4):519-549.

[5] Tiersma, P. Some myths about legal language[J].LawCulture&theHumanities, 2006,2(1):29-50.

[6] 程红军. 国际工程承包英文合同的语体分析[D]. 太原理工大学硕士论文,2009.

[7] 郭贵春,刘俊香. 伽达默尔的理解语境观[J]. 自然辩证法研究,2000,(7):1-6.

[8] 李妮. 预设与语用策略[J]. 山东理工大学学报(社会科学版),2006,(4):28-33.

[9] 刘俊. 从功能文体学角度分析FIDIC合同特点[D]. 西南财经大学硕士论文,2008.

[10] 刘芙蓉,韦薇. 从功能翻译理论角度谈招投标文件的翻译[J]. 海外英语,2013,(4):111-115.

[11] 穆可娟. 法律英语汉译中的术语不可译及其处置[J]. 外语学刊,2015,03:111-114.

[12] 钱嘉慧. 基于语料库工具Wmatrix的《政府工作报告》语义域考察 [J]. 海外英语,2015,(21):217-219.

[13] 孙亚. 基于语料库工具Wmatrix的隐喻研究[J]. 外语教学,2012,(3):7-11.

[14] 孙毅. 基于语义域的隐喻甄别技术初探——以Wmatrix语料库工具为例[J]. 解放军外国语学院学报,2013,(4):10-16+127.

[15] 吴树勤. 用实证主义方法重构法律和语言关系——哈特对法理学“语言转向”的开创之功[J]. 社会科学战线,2006,(2):10-15.

[16]王谦. 海事英语语篇的功能文体研究[D]. 大连海事大学硕士论文,2009.

[17]王贵芳,余卫华. 法律语言研究现状分析[J]. 广东外语外贸大学学报,2015,(2):49-53.

[18] 肖忠华,戴光荣. 汉语译文中习语与词簇的使用特征:基于语料库的研究[J]. 外语研究,2010,(3):79-86,112.

[19] 左尚君,戴光荣. 基于Wmatrix的《红楼梦》两英译本文体对比研究[J]. 嘉兴学院学报,2014,(1):60-66.

[20] 杨年保. 语义预设与语用预设研究[J]. 云梦学刊,2005,(3):119-121.

[21] 余清萍. FIDIC条款的文体特征[J]. 高等建筑教育,2006,(1):80-85.

[22] 张新红. 汉语立法语篇的言语行为分析[J]. 现代外语,2000,(3):54-57.

[23] 张美芳. 利用语料库调查译者的文体——贝克研究新法评介[J]. 解放军外国语学院学报,2002,(3):284-295.

[24] 张明杰. 论法律术语翻译的规范化[J]. 贵州大学学报(社会科学版),2015,(1):165-168.

[25] 张英,赵以. 论法律解释在法律文本翻译中的运用 [J]. 西南政法大学学报, 2015,(4):88-94.

A Corpus Study on Semantic Categories and POS Distribution Patterns in Business English Contracts

WANG Li-fei, WEN Dao-rong

(School of International Studies, University of International Business and Economics, Beijing 100029, China)

This paper explored the stylistic features of the typical EPC contract using the corpus tool of Wmatrix. It focuses on the distributional patterns of semantic categories, POS and word frequency. Compared with BNC written corpus, the study found that 1) the top semantic categories of EPC contracts, are I2.1: Business: Generally and Q1.2: Paper documents and writing, which indicates that, EPC contract is a type of typical legal text for business purpose; 2) the POS features of EPC contracts are mainly NP1 (singular proper name), ZZ1 (singular letter of the alphabet), NN1 (singular common noun), AT (article), DD (determiner), APPGE (possessive pronoun), which further demonstrates the EPC text is not an ordinary commercial agreement, but a business contract with clear-cut legal and formalized nature. The study has implications for Business English reading and writing as well as translation teaching.

business contract; semantic categories; part of speech; corpus analysis

10.16482/j.sdwy37-1026.2017-02-002

2016-11-18

本文为国家社科基金一般项目“中外上市公司年报话语对资本市场的影响预测对比分析”(项目编号:16BYY178)和北京市社会科学基金重点项目“商务人才外语能力的语言学理论基础研究”(项目编号:14WYA006)资助成果。

王立非,男,博士,对外经济贸易大学英语学院教授、博士生导师。研究方向:应用语言学、商务英语。 文道荣,男,讲师,对外经济贸易大学英语学院博士生。研究方向:商务英语。

H030

A

1002-2643(2017)02-0012-09

猜你喜欢
词频范畴语料库
批评话语分析的论辩范畴研究
基于词频分析法的社区公园归属感营建要素研究
正合范畴中的复形、余挠对及粘合
《语料库翻译文体学》评介
Clean-正合和Clean-导出范畴
基于JAVAEE的维吾尔中介语语料库开发与实现
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
以关键词词频法透视《大学图书馆学报》学术研究特色
语料库语言学未来发展趋势