语料库驱动下的《哈克贝利·费恩历险记》词簇分析

2019-09-03 02:56
商丘师范学院学报 2019年10期
关键词:费恩子类历险记

杨 元 媛

(商丘师范学院 外语学院,河南 商丘 476000)

一、引言

语料库一般是语言品种或语言的标准样本,因此语料库是比较一个作者、一个或一些文本与同种语言其他特殊品种异同的很有价值的基础[1]242-243。词簇是一种特殊的频繁出现的多词组合,也被称作多词序列、多词单位或词块[2]。Biber、Cortes、Hyland以及Mahlberg的多项研究运用语料库研究中的词簇这一概念,分析话语中高频出现的多词序列。多词序列作为语言中的意义单位,受到了Sinclair、Partington等学者的广泛关注。

出现在不同语域的词簇,表现出各自独特的结构和功能特征。Biber、Conrad & Cortes对词簇的结构和功能进行了分类,提出了词簇结构和功能类型的分析框架[3][4]。

应用这一框架,对文学文本的词簇进行量化分析。本文对《哈克贝利·费恩历险记》中词簇进行量化研究,基于语料库数据对最低频数为5的151个四词词簇(1)①三词词簇往往是四词词簇的一部分,而相比五词词簇而言,四词词簇的使用更加频繁,在结构和功能上也更富有变化性。所以文章将作品中的四词词簇作为分类研究的对象。进行结构和功能分析。

二、词簇的结构分析

Biber等人.将四词词簇从结构上分为三类,具体为:包含动词短语的词簇、包含从句的词簇、包含名词短语 + 介词短语的词簇[3]。在《哈克贝利·费恩历险记》中,出现最多的是包含动词短语 (VP) 的词簇,达65个;其次为包含名词短语和介词短语 (NP+PP) 的词簇,57个;包含从句 (Dep Clause) 的词簇出现率较低,为20个;还存在比较独特的一类词簇,即副词短语 (Adv) 构成的词簇,如and by and by,共9个。

Biber等人又将包含动词短语的词簇细分为七个子类,即第一/第二人称代词 + 动词短语、第三人称代词 + 动词短语、话语标记语 + 动词短语、非被动态动词短语、被动态动词短语、Yes-no 问句片段、WH问句片段。《哈克贝利·费恩历险记》中,出现频率最高的为第四个子类,即非被动态动词短语,词簇数为30,而被动态的动词短语却没有出现。具体用法如索引行所示:

(1)I judged he had got drowned,and I wasn’t ever going to get out any more.I was scared.ImadeupmymindI would fix up some way to leave there.

其次为第一子类,即第一/第二人称代词+动词短语,词簇数为20,如以下索引行所示:

(2)I didn’t know howIwasgoingtoset still.This miserableness went on as much as six or seven minutes;but it seemed a sight longer than that.

第二子类,即第三人称代词+动词短语,词簇数也较多,为13个,如以下索引行所示:

(3)It’s always called so when a king escapes,f’rinstance.And the same with a king’s son;itdon’tmakenodifference whether he’s a natural one or an unnatural one.

这说明,在作品中,作者马克·吐温使用很多的动词短语来描述人物的行为和故事情节的发展变化,而且习惯使用主动语态的动词短语,避免用被动语态来进行表达。

包含从句的词簇在文中使用较少,说明作品中语言更口语化,多使用句子结构不太复杂的简单句,较少使用结构复杂的复合句。包含从句的词簇被Biber等人进一步分为五个子类,即第一/第二人称代词 + 从句片段、WH-从句片段、If-从句片段、To-从句片段、That-从句片段。在作品的这一类词簇中,频数最高的是第五子类,即That-从句片段,出现7个不同词簇。值得说明的是,由于作品语言风格上的口语化特点,That-从句片段中的连词That在作品中均被省略。如以下索引行所示:

(4)Little Tommy Barnes was asleep now,and when they waked him up he was scared,and cried,andsaidhewantedtogo home to his ma,and didn’t want to be a robber any more.

除了上文提到的五个子类外,包含从句的词簇增加了一个新的子类,即状语从句构成的词簇,在文中出现1个,如索引行:

(5)Well,asIwassaying,we waited that morning till everybody was settled down to business,and nobody in sight around the yard.

包含名词短语 + 介词短语的词簇有五个子类,包括带有of-短语的名词短语、带有其他后置修饰成分的名词短语、其他名词短语、介词短语和比较性表达方式。在作品中,带有of-短语的名词短语,及介词短语出现较多,均为20个,参看以下的索引行范例:

(6)I made two mile and a half,and then struck out aquarterofamileor more towards the middle of the river,because pretty soon I would be passing the ferry landing,and people might see me and hail me.

(7)I got an old tin lamp and an iron ring,and went outinthewoodsandrubbed and rubbed till I sweat like an Injun,calculating to build a palace and sell it.

与Biber等人的分类不同,文学作品《哈克贝利·费恩历险记》中又增加了一个新的结构类型,即包含副词短语的词簇。作品中共出现9个此类词簇,范例如and by and by,这个词簇在小说中共出现24次,这也是出现频次最高的一个词簇。有以下索引行为例:

(8)I practiced around all day to get the hang of the things,andbyandbyI could do pretty well in them,only Jim said I didn’t walk like a girl;and he said I must quit pulling up my gown to get at my britches-pocket.

词簇的具体结构类型见表1。

表1 词簇的结构类型表

Biber 研究了口语对话和学术文章中的四词词簇。将《哈克贝利·费恩历险记》中的四词词簇结构类型与之相比较发现,作品中最常用的是包含动词短语的词簇,这一点与口语对话中词簇的结构类型特征相一致;而作品中包含名词短语 + 介词短语的词簇数目远多于包含从句的词簇,这一点与学术文章中词簇结构类型分布是一致的。Biber 的研究结果表明,学术文章中不存在包含动词短语的词簇,这与《哈克贝利·费恩历险记》的词簇结构分布又是不一致的[5]。由以上分析可以看出,《哈克贝利·费恩历险记》这部作品的词簇结构分布特点介于口语对话和学术文章之间,既具有很强的口语性,又有一定的学术色彩。

三、词簇的功能分析

在话语中,词簇主要表现出三种功能,具体为表达态度、表明语篇结构、提供指示框架。在《哈克贝利·费恩历险记》中,出现最多的是起表达态度功能的词簇 (Stance bundles),为89个;其次为起提供指示框架功能的词簇 (Referential bundles),50个;表明语篇结构的词簇 (Discourse organizers) 最少,仅为12个。

表达态度的词簇可分为两个子类,表达认知立场的词簇及说明立场态度/传递模式的词簇,其中说明立场态度/传递模式的词簇又可细分为传达期望、义务/指令、意向/预测、表述能力四类词簇。《哈克贝利·费恩历险记》中未出现表达认知立场的词簇,而用于说明立场态度/传递模式的词簇较多,使用词簇最多的是表达意向、预测将来的一个子类,词簇数为63个,用法如索引行所示:

(9)We struck it mighty lucky;therewasgoingtobea circus there that afternoon,and the country people was already beginning to come in,in all kinds of old shackly wagons,and on horses.

表明语篇结构的词簇也可分为两个子类,用于话题介绍及进行主题阐述或解释的词簇。这两类在文中出现频数较少。这说明,作者用作阐述主题、表达语篇结构的词簇不多,形成了一种富于口语化特征的文学语言。

提供指示框架的词簇包括用于识别/聚焦焦点、进行不精确性描述,详述属性、提供时间/地点/文本参照四个子类。这类词簇在文中出现了50个,也是作者使用较多的一类词簇。其中使用最多的是C类中说明数量规格的词簇和D类中描述参照地点的词簇,分别为11个和19个,在句子中的具体使用情况见索引行:

(10)She said she’d have her frocks andalotofothertraps took out of her room if they was in Uncle Harvey’s way,but he said they warn’t.

(11)The king allowed he would go,too,and see if he couldn’t strike something.We was out of coffee,so Jim said I better go along with theminthecanoeandget some.

作者较多地使用这类词簇来表达数量、地点的变化,具体生动地展示出故事发展的脉络和故事发生场景的不断演变。

词簇的功能类型见表2。

表2 词簇的功能类型表

与Biber对口语对话和学术文章中四词词簇功能分析的研究相比较,发现《哈克贝利·费恩历险记》中最常用的是表达态度的词簇,这一点与口语对话中词簇功能类型分布是一致的;提供指示框架的词簇数目远多于表明语篇结构的词簇,这一点与学术文章中词簇结构类型分布是一致的。分析结果说明,《哈克贝利·费恩历险记》这部作品的词簇功能分布同样介于口语对话和学术文章之间,词簇所表达的功能接近于口语对话的特征,同时与学术文章也有一定的相似之处。

四、结语

运用语料库文体学的方法,分析作品《哈克贝利·费恩历险记》的关键词,可探知有关作品主题、环境、主要情节和语言特色的很多信息。分析作品中高频词簇的结构,发现:(1)作品使用丰富的动词短语来描述主要角色的活动和故事情节的变化,而且习惯使用主动语态的动词短语,避免用被动语态进行表达;(2)作品中使用大量的包含名词短语和介词短语的词簇,及部分包含副词短语的词簇,而包含从句的词簇在文中使用较少,说明作品中语言更富口语化,句子结构不太复杂。分析作品中高频词簇的功能,发现:(1)起表达态度,特别是传达意向、预告将来功能的词簇最多;(2)其次为起提供指示框架功能的词簇,特别是说明数量规格的词簇和描述参照地点的词簇,展示出小说描写的具体细腻,生动展示出故事发生场景的不断演变;(3)表明语篇结构的词簇最少,这也说明小说具有口语化特点。与Biber 对口语对话和学术文章中的四词词簇的研究比较,发现《哈克贝利·费恩历险记》的词簇结构和功能特点介于口语对话和学术文章之间,接近于口语对话的特征,同时与学术文章也有一定的相似之处,形成了一种富于口语化特征的文学语言。以语料库为支撑,将语料库方法应用于文学文本的研究中,提供了一种新型的文本分析方法,有利于帮助我们研究文学文本意义和形式之间的关系。

猜你喜欢
费恩子类历险记
冰河时代历险记
卷入Hohlov算子的某解析双单叶函数子类的系数估计
地心历险记
Java面向对象编程的三大特性
寻影历险记
我只需要一美元
充满爱心的两美元
杉米的迁徙历险记(二)
Java类的继承
费恩的成全