“破晓”一词的词类标注问题:一项基于语料库的个案研究

2015-05-30 00:27柴宁
东方教育 2015年9期
关键词:语料库

柴宁

【摘要】文章从基于使用的语言学理论和词类范畴化两个视角出发,采取基于语料库的研究方法, 对“破晓”的使用模式进行调查,结果表明“破晓”经过词类范畴化这一动态过程在词典中应处理为动名兼类词。本研究试图对词典编纂中词类标注不明确的词语的完善贡献绵薄之力。

【关键词】词类标注;语料库;范畴化;“破晓”

一、研究问题

词类标注是词典编纂的重要环节之一,特别是对兼类词而言。各部词典对词类标注的标准不一,造成了词语义项的不一致,为读者掌握词语用法带来了一定的困扰。随着电子计算机技术的普及推广,语料库被越来越多地投入到词典编纂的工作当中,成为词类标注的重要依据之一。然而在编纂词典的过程中,业界一直沿用传统方法即以总结实际用法为主,这必然是不科学的,也是不客观的,因此将语料库引入词典编纂迫在眉睫。经过对多部词典的调查取证,笔者发现“破晓”一词在各个词典中的词类标注不一致,读者很难对该词的词类做出快速准确的判断,那么就需要借助语料库这一现代技术了。本文以范畴化理论为基础,以“破晓”为例考查它的词类、释义以及例证,试图探究出一种借助语料库而进行词类标准的全新方法。

二、研究过程

(一)词典考证

为确保研究的客观公正,笔者选取了21部较权威的词典对“破晓”一词的词类进行统计,其中汉英词典中已标注词类的7部,未标注词类的6部,汉语词典已标注词类的6部,未标注词类的2部:

7部已标注词类的汉英词典:

【破晓】<动>dawn;daybreak:我们必须在~前出发。We must start before dawn./这时天已~。By this time it was daybreak.《新汉英词典》(2007)

【破晓】 <动> dawn:~时分 at daybreak /天色~。Day is breaking.《牛津·外研社英汉汉英词典》(2010)

【破晓】 <名>dawn;daybreak:~时分 at the crack of dawn;at daybreak / 天将~。Day is breaking.《外研社 · 精编英汉汉英大词典》(2010)

【破晓】 <动&名> dawn;break;<名> daybreak:天刚刚~。The day was just breaking(dawning).《简明汉英词典》(山东教育出版社)(1992)

【破晓】 <动·不及物> 天刚亮 daybreak:天色~ Daylight is dawning./东方~ Dawn is breaking in the east.《汉英双解词典》(1997)

【破晓】N.dawn;daybreak V.explain;clarify;show light 《ABC汉英大词典》(2003)

【破晓】 <名> dawn;daybreak:~时分 at the crack of dawn;at daybreak / 天色~。Day is breaking 《新世纪汉英词典》(2003)

6部未标注词类的汉英词典

【破晓】dawn;daybreak:~时分 at the peep of day;at dawn / 天将~.Day is breaking./在~时 at the crack of dawn /~时雨停了。The rain left off at the day.《汉英大辞典》 (1993)

【破晓】 dawn;daybreak:~时分 at dawn;at the peep of day /天将~ Day is breaking.《现代汉英词典》(2005)

【破晓】 dawn;daybreak:~就起程 set out at daybreak /一醒来,天已~。It was dawn when we woke up.《新时代汉英大词典》(2000)

【破晓】 dawn;daybreak:~时分 at dawn;at the peep of day 《21世纪汉英词典》

【破晓】 dawn;daybreak:~时分 at dawn(或daybreak)《当代新编汉英词典》

【破晓】 dawn;to dawn 《万人现代汉英词典》(1994)

通过对这十三部汉英词典的分析,笔者发现其中5部汉英词典识别“破晓”为名动兼类词条,4部汉英词典识别“破晓”为动词词条来处理,还有4部汉英词典将“破晓”定义为名词词条。各部汉英词典对该词的词类标注情况各不相同,有必要进行进一步的商榷。

根据汉英词典译义一贯遵循的“词类对译”原则,本文尝试通过调查汉语词典对“破晓”一词的释义情况,做出一定程度的解释:

6部已标注词类的汉语词典:

【破晓】<动>天刚亮。天已~。 《当代汉语词典》(2009)

【破晓】<动>天刚刚亮。天已~。~时分。《现代汉语规范词典》(2010)

【破晓】<动>(天色)初明。天刚~,勘探队员就出发了。《应用汉语词典》(2006)

【破晓】<动词,述宾型合成词> 作谓语:天色~了。作定语:~时分。时间定在~之时。作宾语:你们这一班值到~,再换下一班。《现代汉语规范用法大词典》(2000)

【破晓】<动>(天)刚亮。《辞海》(2002)

【破晓】<动>(天)刚亮。天色~。《现代汉语词典》(2012)

2部未标注词类的汉语词典:

【破晓】天刚亮。《新华词典》(2006)

【破晓】天刚蒙蒙亮。宋·陆游《杏花》诗:“念当载酒醉花下,~啼莺先唤人。”《近代汉语大词典》

由此看出,无论是汉英词典还是汉语词典,对“破晓”一词的词类标注都不统一或者不明确。这让我们不得不对该词进行重新定义,一探究竟。

(二)语料库的调查统计

既然汉语词典给出对“破晓”一词的解释不足以说明问题,那么本文将借助语料库对该词进一步调查研究。本调查选择了北京大学中国语言学研究中心(Center for Chinese Linguistics PUK,简称CCL)语料库,对“破晓”一词进行了全面检索,得到220条相关语料可供调查。一个词的意义与其组合关系特征或搭配有着密切的关系,通过语料库提供的组合关系或用法模式调查无疑可以提供重要的线索(王仁强,2006)。因此经分析这220条语料后得出如下结果:

该表格表明 “破晓”一词在语言使用中做名词(53.6%)和做动词(46.4%)的频率不相上下,这就说明了前面研究过程中选取的几部词典对“破晓”一词的词类标注都是不准确的,根据语料库的检索结果,我们需要对该词的词类进行重新定义。

三、分析与结论

(一)基于使用理论的词类分析

基于使用的语言学理论认为被使用的语言才具有参考价值,语言结构是在使用的过程中逐渐形成的,其使用频率决定了语言的形式,同时语言结构在使用的过程中不是一成不变的,经常被改变的使用方式逐渐演变成习语,成为一种固定的语言结构。因此通过分析某个词的经常性用法,将有助于判断该词在语言层面的词类归属。

在全面分析CCL语料库中“破晓”一词的220条语料之后,我们得出上表的数据。其中“破晓”一词有两种常见的用法,第一是与“天、天色、东方”等词搭配使用,作谓语动词;第二是与“~之际”“ ~时分”“待到~的时候”等搭配使用,作表示时间点的名词。“破晓”一词本意是表示天刚刚亮的动词,人们常将它用来表示时间(词的规约性用法),久而久之,它便具有了表示时间点的名词词性。该数据结果表明“破晓”一词是名动兼类词。因此各部词典应该为该词的名词词类和动词词类分别设立义项。

(二)基于使用理论的语义分析

从选取的21部词典对“破晓”一词的解释,我们可以看出汉语词典只把“破晓”的解释为动词,意为“天刚刚亮”,汉英词典的解释则有两种情况,一是动词,意为“天刚亮(dawn;break)”;一是名词,意为“天亮时分(dawn;daybreak)”。

通过语料库检索的220条语料,我们得出了上表的结论,并据每条语料的语境分析了“破晓”的常见搭配和用法。如上所述,破晓有动词和名词两种词性,不仅可以与“天、天色、晨曦、东方”等词搭配使用表示“天刚刚亮”,还可与“~之际、待到~的时候”等搭配使用表示时间点。以下是从CCL语料库中有关“破晓”的一些例句:…在太平洋彼岸的符拉迪沃克,天正破晓…(动);…23日,天未破晓,在一片漆黑中,仅仅凭借一盏信号灯的微光,他们…(动);…他不时地坐在大街上的长凳上小歇一会,破晓时分,便信步朝切而西堤走去…(名);…忽然间她又重新每天和五六个男人约会,到破晓才困顿不堪地入睡…(名)。由此可见,“破晓”的本意是“天刚刚亮”,但在人们的长期使用过程中,逐渐将破晓视为一个表示时间概念的名词,意为“天刚亮的时候”。

基于语料库的研究和对词典释义的分析,我们认为汉语词典应该把“破晓”一词的词类标注为:

【破晓】<动>天刚刚亮。天已~。

<名>天刚亮的时候。在~时分

而根据“词类对译”原则,汉英词典应该把“破晓”一词的词类标注为:

【破晓】 <动> dawn;break:天色~ Day is breaking.

<名> daybreak:~时分 at the crack of dawn;at daybreak

(三)基于范畴化理论的词类分析

认知语言学(王寅,2007)认为,范畴化是一种对事物的分类过程,属于人类的一种基本认知活动。人类在纷繁复杂的自然与社会现象中设法寻找它们的相似性,再根据这些相似性对一切事物进行分类并形成概念。同理,词类的确定也就是人们对词的使用情况的总结和归纳。

与经典范畴理论不同,原型范畴理论认为同一范畴中的所有成员并非一定具有相同的特征;相反,同一范畴中的成员是由原型与边缘成员之间的家族象似性决定的;同一范畴中的成员以原型为典型代表(或中心)聚集在一起,其他成员向外扩散,所具有的该范畴的典型特点也逐渐减少;各个范畴没有明确的边界。根据该理论,词类范畴中各成员也有中心和边缘的地位之分。中心成员具有该范畴的典型特征,边缘成员的典型特征逐渐减少,并且与其他词类范畴成员融合,不仅具有该词类特征,有时还兼具一些其他词类的特征。

在交际活动中常常会出现词语在特殊语境下的灵活运用,如果某种用法偶尔出现,就不会在语言中固化,那么它只是词语的活用,没必要在词典中另立条目;反之,如果灵活运用的频率高,那么就会形成一种固定用法,则应该在词典中注明。这就是去范畴化和再范畴化的过程,二者常相伴而生,有些词会在使用中逐渐失去某些典型范畴特征,而有些词会在使用中产生其他范畴的特征,并逐渐固化,无论哪种变化,都应该及时在词典修正过程中予以注明。

本文研究的“破晓”也属于这种现象。语料库的检索发现“破晓”可做谓语动词,以“天、天色、晨曦、东方”等词为主语,还可与其他名词或附助词连用,构成 “破晓时分”或“破晓的天空”等短语。因此“破晓”属于兼类词范畴,既可作动词也可作名词。调查中所使用的21部词典中,只有两部汉英词典将该词定义为动名兼类词,其余词典都或将其定义为名词,或将其定义为动词,且汉语词典和汉英词典对其词性的标注不完全一致,显然是没有使用语料库进行调查研究,没有生动现实的语料作为参考,对“破晓”的词类范畴仍然坚持传统的定义,造成了义项缺失译义不完整等问题,给语言学习者带来了不便。

(四)词类标注对汉英词典译义的影响

近年来,词类标注开始得到很多学者的关注,因其对汉英词典的译义有着深远的影响。大体看来,汉英词典标注词类有以下几点好处:(1)有助于说解词语的用法;(2)有助于确定词语的义项;(3)有助于提高译义的准确性;(4)有助于配例与词类的协调;(5)有助于提高词典的使用效率;(6)有助于解决汉语的词类问题(王仁强:2006)。在词典编纂过程中兼类词的词类标注是重中之重,只有准确把握一个词的所有词类,才能根据词类分设义项,并进行准确译义,从而保证词语译义的完整与准确。以本文中“破晓”在各部词典中的词类标注情况为例:《新世纪汉英词典》(2003)只给“破晓”标注了名词,而《新汉英词典》(2007)中只给“破晓”标注了动词,但是这两部词典对“破晓”给出的例句却既有名词的用法,也有动词的用法。这样容易给语言学习者造成误会,带来学习和使用的不便。经过调查研究我们可以看出,正确的词类标注对词典编纂至关重要,它不仅明确了兼类词的处理方法,更关系到词典译义(释义)的准确性。

四、结语

人们常说,没有调查就没有发言权。词类的确定不能仅凭直觉或已标注词类的汉语词典,这样词典的重新修订也很难有实质性更新。因此今后的词典编纂应将大型语料库作为重要依据,以现实语料为参考归纳词的常态用法,确定词类,从而对其进行准确释义。同时,汉英词典的编纂不能仅过度依赖汉语词典,也应该以语料库为基础,才能保证词典译义的准确性和客观性。

参考文献:

[1]邱琳.范畴化视角的汉英词典名动兼类实证研究—以“拍卖”为例[J].四川教育学院学报,2011(9).

[2]王仁强.认知视角的汉英词典词类标注实证研究[M].上海:上海译文出版社,2006.

[3]王寅.认知语言学[M].上海:上海外语教育出版社,2007.

[4]周培树.“倾斜”是倾斜于动词还是形容词?—一项基于语料库的研究[J].成都师范学院学报,2013(6).

猜你喜欢
语料库
《语料库翻译文体学》评介
基于语料库的“はずだ”语义用法分析
基于语料库“隐秘”的词类标注初步探究
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
基于英汉双语平行语料库的无根回译研究
基于语料库的近义词辨析研究——以suspect和doubt为例
低碳经济英语语料库建设与应用
基于网络语料库的“给力”研究