基于自建语料库对中美银行企业英文简介的对比研究

2016-05-30 18:26解婷
校园英语·中旬 2016年11期
关键词:文体特征语料库词汇

【摘要】本文利用Antconc语料库检索软件以及Chi-square Calculator卡方计算器,通过自建两个小型可比语料库,量化分析了中美各15家银行企业英文简介的文体特征,主要从词汇层面进行比较分析。这一实证研究表明中国银行简介与美国银行简介之间存在差异,具体体现在词汇密度,用词差异特征等方面。通过分析差异存在的原因,给予中国企业一些建议,希望对中国企业在今后的英文简介中有些许启示。

【关键词】语料库 银行简介 文体特征 词汇

一、引言

语料库(Corpus)是为专门用途设计的、具有特定结构、能通过计算机程序进行检索,达到一定规模的有代表性的语料的集合。特别是随着语料库检索的出现, 过去以定性为主的文体分析, 可以引入科学的定量分析, 从而提供了一个全新的语篇分析视角。这种定性和定量相结合的研究方式, 能够更为客观地揭示语篇的文体特征及语言风格。随着全球经济一体化速度不断加快,我国越来越多的企业都制作样本,建立网站,发布汉英对照版或者英文版的企业简介。基于此,本文尝试利用语料库检索软件Antconc对中美15家银行企业从词汇层面进行对比分析,揭示中美银行简介的差异。

二、基于中美银行企业英文简介的对比研究

1.语料库的建设。自建两个可比语料库子库A和子库B,子库A为15家中国银行的英文简介,子库B为15家美国银行的英文简介。所有简介均来源于企业官网中About us部分。抽取的15家中国银行中有中央银行、国有商业银行,也有股份制商业银行,抽取的美国银行也遍布全国,均属于随机抽样。企业名单如下:

中国银行英文简介语料库企业名单:

中信银行、中国银行、中国人民银行、中国农业银行、中国民生银行、中国建设银行、中国光大银行、中国工商银行、招商银行、兴业银行、浦发银行、平安银行、交通银行、华夏银行、广发银行

美国银行英文简介语料库企业名单:

亚特兰大银行、夏威夷银行、摩根大通银行、美洲银行、美国花旗银行、美国恒丰银行、荷兰银行北美控股公司、联邦储备银行、加利福尼亚美洲银行、汇丰银行、华美银行、美国合众银行、国泰银行、城市国家银行、北美银行

2.研究工具。本研究所采用的工具是语料库检索软件Antconc3.2.2和卡方检验计算器Chi-square Calculator。Antconc具有词语检索(Concordance)、生成词表(Word List)和主题词(Keyword List)三大功能。Chi-square Calculator检索出的卡方值表明该值在显著性水平上是否有意义。

3.研究方法。通过比较两个不同大小的语料库,可以得到主题词,也就是所研究的语料库中频率超常的词语。计算主题词需要两个语料库,一个是观察语料库(observed corpus),一个是参照语料库(reference corpus)。一般来说,参照语料库要比观察语料库大一些(付海燕,夏慧言,陈建生,2011)。本研究旨在利用Antconc三大功能,以子库A作为参照语料库,以子库B作为观察语料库,通过提取主题词,对子库A与子库B在词汇方面进行定量分析,探索中美银行企业简介的异同。

三、词汇研究结果与分析

1.总体文本特征对比。词汇密度在一定程度上可以反映文本用词的多样性。测量词汇密度的主要工具是类符/形符比(Type/Token Ratio,简称TTR),由于不同容量的语料库类符/形符比不具可比性,故一般使用标准化类符/形符比(Std. TTR)来衡量语料库的词汇密度。该值高,则文中出现的重复词就少,该值低,则文中出现的重复词就相对较多。

利用Antconc检索得出子库A与子库B的类符形符数(表1),进而计算得出子库A的词汇密度为19.837,子库B的词汇密度为35.860。用卡方检验子库A和子库B的词汇密度是否具有显著性差异,得到卡方值为47.82,说明在自由度为1,显著性水平为0.001时,是有意义的。

因此,美国银行简介较中国银行简介词汇密度高,因而重复率低,用词丰富,而中国银行简介用词则重复率高,用词单一。

2.主题词表。在语料库分析中,在单篇或多篇文本中具有超高复现频率的词称作主题词。通过观察主题词,可以发现任一给定文类或主题文本的词语特征。鉴于本研究中子库A的规模大体相当于子库B的三倍,将子库B作为观察语料库,将子库A作为参照语料库。利用Ant.Conc主题词提取功能,得出主题词表。所列词汇表明在子库B中的使用频率明显高于在子库A中的使用频率。

从上图可以看出,we和our的出现频率非常高,考察we出现的词群,经常出现在“we offer…”, “we aim…”, “we combine…”等宣传企业及表明为顾客服务的话语中。在这些语境中,用第一人称“we”指代本公司,这样将公司人格化,拉近了与读者的距离。而our的词群则是“our customers…”, “our goal…”等搭配的结构中。突出了我们公司是一个很大的团队,我们有信心提供优质的服务,有利于向民众宣传企业良好形象。而we和our在子库A中出现的频率明显偏低,其中we出现16次,our出现26次,而在子库B中分别出现76次和50次。

四、结语

本文利用Antconc语料库检索软件,通过自建小型可比语料库对中国银行和美国银行的英文简介进行量化比较分析,发现两者在词汇特征方面存在差异。通过以上分析,得出企业简介具备的语言特点,以达到最好的宣传企业信息的目的。这种定量和定性相结合的语料库检索分析方法,可以丰富研究文本的视角,更合理的诠释文本的信息。

参考文献:

[1]曹和建.基于语料库的商务英语研究[M].广州:对外经贸大学出版社,2008.

[2]梁茂成,李文中,徐家金.语料库应用教程[M].北京:外语教学与研究出版社,2010.

[3]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2004.

[4]廖乙翰.基于小型语料库检索对英文企业简介的文体分析[J].黑龙江对外经贸,2010(5),85-121.

[5]付海燕,夏慧言,陈建生.基于语料库的中美大学英文简介研究[J].中国轻工教育,2011(2),89-92.

[6]石春让,林庆扬,李琳.基于语料库的中企简介翻译研究[J].西北大学学报,2012(9),180-182.

作者简介:解婷(1990-),女,汉族,陕西渭南人,现就职于陕西国际商贸学院基础课部,研究生,助教,主要研究方向:英语教学。

猜你喜欢
文体特征语料库词汇
本刊可直接用缩写的常用词汇
一些常用词汇可直接用缩写
《语料库翻译文体学》评介
本刊可直接用缩写的常用词汇
网游小说的文体特征分析
基于JAVAEE的维吾尔中介语语料库开发与实现
本刊一些常用词汇可直接用缩写
语料库语言学未来发展趋势