基于语料库的白先勇小说《玉卿嫂》的分析研究

2019-04-21 08:52姜营
文教资料 2019年36期
关键词:白先勇分词语料库

姜营

摘    要: 通过语料库语言学的研究方法,主要运用CIPP-CTOOLS 和AntConc软件对白先勇早期代表作品《玉卿嫂》进行叙事视角、文本内容、主要人物、情节发展等方面的分析研究。

关键词: 语料库    CIPP-CTOOLS    AntConc    白先勇    《玉卿嫂》

一、引言

近年来,语料库语言学得到越来越多的关注,它首先能够为研究者提供大量的真实语料,其次,能够基于这些语料提供统计数据,随后研究者们能够依据统计数据结果验证现行的理论,或是构建新的理论。而利用语料库技术对语体风格进行量化研究,是近些年来语料库语言学研究的新进展,也是语体风格研究在方法论上的重要突破。这种基于统计方法,采用量化手段研究文学作品的文体风格的研究思路是一种全新的思路,以真实、宏观、大数量的语言事实为依据,为研究结果的客观性和科学性确立了可靠的物质基础,为内省体验研究提供了客观、公正、有效的支持。

文章采用基于语料库的研究方法,以白先勇的早期中篇小说《玉卿嫂》为研究对象,首先利用中文分词软件CIPP-CTOOLS对所有语料进行分词,然后利用语料库检索软件Antconc来分析小说的叙事角度、文本内容、语言特点、人物塑造以及情节发展等方面以达到对作品更加理性化的分析。

二、小说背景介绍

中国台湾著名作家白先勇先生的小说《玉卿嫂》一直受到文学界的称誉和广大读者的喜爱,被拍成电影后,杨惠珊主演的玉卿嫂更是在青年观众群中产生了较大的影响,后又被改编成越剧,并于2005年在上海国际艺术节上公演获得了极大成功。白先勇是一位善于描写旧时代女性的作家,玉卿嫂便是其早期塑造的不朽人物形象之一,虽然这部作品的成熟度不及后来的作品,但是对深入了解白先勇的许多作品有着不容忽视的意义。

三、研究方法

本文主要采用中文分词软件CIPP-CTOOLS进行分词处理和AntConc 3.2.4w作为语料库检索工具,以《玉卿嫂》为研究对象,为文学语言分析、人物鉴赏提供新思路。主要利用AntConc软件中的生成词表(Word List)、索引Corcordance和索引定位(Corcordance Plot)等功能,对文本中的主要人物、故事情节、人物刻画、语言特点等内容进行分析。

(一)通过AntConc中“Word List”工具分析叙事角度及文本内容

运用语料库软件AntConc中的Word List工具对小说《玉卿嫂》进行叙事角度和文本内容的分析,在检索之前,先利用中文分词软件CIPP-CTOOLS对所有语料进行分词。由于当前的中文分词软件还有待完善,所以计算机自动分词结果还不能完全让人满意。因此,对《玉卿嫂》语料库的分词结果进行人工校对,主要纠正了一些有关人名的分词结果的错误。然后点开Antconc 3.2.4w软件,打开《玉卿嫂》,点击菜单中的Word List选项卡,即出现文本中的用词频率表。

首先,观察人称代词的出现频率,“我”出现734次,位于第1位。“她”出現330次,位于第4位。“你”出现207次,“他”出现205次,分别位列第8位和第9位。“我们”出现86次,位于第22位。通过人称代词的频率和排名,可以清楚地知道小说《玉卿嫂》的叙事角度是利用第一人称“我”进行的叙述。且在叙述中,女性代词的使用多于男性代词的使用,说明这部小说作品中的主人公主要是女性。

其次,涉及人物名称的频率和排名中,“玉卿嫂”出现的频率是164次,排名13位,“庆生”出现的频率是130次,排名16位,从人名中我们可以发现《玉卿嫂》小说中涉及的人物主要是玉卿嫂和庆生两人,该故事是围绕玉卿嫂和庆生两个人展开的。

通过对前50位频率词的搜索,可以发现“了”字出现的频率是635,位居第三位,所以本文叙述的很多事情都是已经完成的。另外,“说”字在文中出现的频率是84,位居第23位,“道”出现的频率为67,位居第31位。这一方面表明文中多是以对话的形式展开的,这是此小说文体特征的一个很大的特点。用对话的形式可以将文中各个人物的语言特色清晰地表达出来,从而能够鲜明地表现出各个人物的性格。另一方面“说”为白话文词语,“道”为文言词语,其表明文言词语和白话文相融合的语言风格特点。此外,“看”出现了81次,位居第25位,可以看出这是一个通过叙述者用眼睛“看”来一层一层解密的故事。

此外,有些高频词也是其他文本所共有的高频词(人名除外),像出现次数较多的“的”“要”“是”等。

(二)运用“Concordance Plot、Collocate”分析主要人物

运用检索情节“Concordance Plot”工具直观地再现了关键词在整个文本中的位置及疏密程度,随后使用“Collocate”工具考察与主人公同现程度较高的词,借此分析主要人物的性格特点。

在“concordance plot”搜索栏中输入关键词“我”,得到结果如图1。

从“我”在文本中的分布情况可以发现,“我”出现频率最高,共有734次。在“Collocate”里检索“我”时,和它搭配的有“奶妈”“她”“喜欢”“讨厌”“玉卿嫂”“庆生”“看”等词。从这些词,结合小说,我们可以知道,“我”是一位孩童,身份是一位“少爷”,“玉卿嫂”是“我”的“奶妈”,“我”很喜欢“玉卿嫂”。“我”同样也认识庆生。文本是以一位孩童的“第一人称叙事视角”进行的有关创作,通过小少爷天真无邪的眼睛来“窥探”成人世界的情感风暴。

在“concordance plot”搜索栏中输入“玉卿嫂”,得到结果如图2。

从“玉卿嫂”在文本中的分布情况可以发现,可以发现,玉卿嫂一直贯穿整个作品,出现频次为164次。在“Collocate”里检索“玉卿嫂”时,和她搭配的词主要有“寡妇”“长得好”“少爷”“干弟弟”“庆生”“不要离开”等,我们可以发现玉卿嫂是一位漂亮的“寡妇”,在“少爷”“家里做奶妈,他有一位“干弟弟”同时也是他所深爱的人的名字叫“庆生”。她最大的愿望是希望庆生不要离开自己,可以一直在自己的身边,永远和庆生在一起,不分离。

在“concordance plot”搜索栏中输入“庆生”,得到结果如图3。

从“庆生”在文本中的分布情况可以发现,与“玉卿嫂”的分布情况相比较,“庆生”在文本的前一部分并未出现,主要出现在文本的中间和末尾,并不经常与“玉卿嫂”同现。在“Collocate”里检索“庆生”时,和它搭配的词主要有“体面”“软胡须”“依顺”“瘦瘠”“金燕飞”“发抖”“玉姐”“野鸳鸯”“血”等,从中可以得知,“庆生”是一个十分年轻帅气但身体瘦弱的男生,他依靠着玉卿嫂活了下来,他也对玉卿嫂十分的依顺,二人是一对“野鸳鸯”,但是在后面他遇到了金燕飞同时也找到了自己的真爱。

在“concordance plot”搜索栏中输入关键词“金燕飞”,得到结果如图4。

从上图可以看出,“金燕飞”在文本中出现的次数并不多,只有8次,而且主要在文本的末期出现。在“Collocate”里检索“金燕飞”时,搭配的词语主要是“嫩”“嫩红”“旦角”“庆生”等词语,可以发现“金燕飞”年轻漂亮,与庆生二人年龄相仿同时也互生情愫。

在“concordance plot”搜索栏中输入关键词“看”,得到结果如图5。

从“看”在文本中的分布情况可以发现,“看”虽然出现频次不多,只有81次,但是在全文的重要人物“玉卿嫂”和“庆生”出现时都有重要的分布,“看”具有推动文本情节发展的作用。在“Collocate”里检索“看”时,和它搭配的词主要有“我”“玉卿嫂”“庆生”“金燕飞”“血”等,从中可以得知,“看”主要是“我”在看,通过“我”得“看”来推动文本故事情节的发展。

(三)运用“Keyword List、Concordance Plot、File view”分析情节发展

在上文的Keyword List,Concordance Plot以及通过Concordance 的使用,我们可以知道文本的叙事视角、故事中的主要人物以及推动故事情节发展的关键词,现在利用AntConc语料库检索软件中的“File view”检索词语关键词“看”,我们可以发现,大致的情节发展如下;首先是“我”看到新来的奶妈玉卿嫂觉得格外亲近,到“我”看到家仆们“欺负”玉卿嫂,接著“我”发现玉卿嫂对庆生一往情深,庆生却对玉卿嫂有些惧怕,再到“我”看到庆生和金燕飞走在一起,被玉卿嫂发现,最后“我”看到玉卿嫂拿着刀,和庆生一起倒在血泊中。从中我们可以发现旧时代女性玉卿嫂是有一种反抗传统封建思想精神的,顶着寡妇身份的她深爱着庆生,愿为其付出一切,她有着对爱情自由的渴望与追求。然而,庆生的真爱却是属于别人的,玉卿嫂知道以后,她的爱已经走向了极端,对爱的执念和强大的占有欲充斥着她的内心,于是为了与庆生不分离便在杀死庆生后又选择了自杀,玉卿嫂的反抗显示了其无力性,最终的死亡结局让他们得以“解脱”。

四、总结

以上运用语料库检索对白先勇的小说《玉卿嫂》进行了分析,准确清晰地把握了小说的发展脉络,并对其叙事视角、文本内容、人物特点和语言风格进行了统计分析。虽然以语料库为工具对文本的分析不能代替对文学文本本身的鉴赏,但是可以为文本分析提供一个更加理性化的角度。因此,将语料库技术与文学文本进行结合,可以为文学研究另辟蹊径,使读者对小说有一个更加全面的认识。

参考文献:

[1]邢嘉锋,严敏芬.基于语料库的诗歌语言研究——以莎士比亚十四行诗为例[J].湖南社会科学,2016(03):191-195.

[2]胡开宝,崔薇.基于语料库的莎士比亚戏剧汉译本中“使”字句应用的研究[J].外语教学,2016,37(01):102-106.

[3]胡开宝,毛鹏飞.基于语料库的莎士比亚戏剧中“lord”人际意义再现研究[J].解放军外国语学院学报,2015,38(05):100-107.

[4]陈婵,程乐.莫言作品《蛙》的语料库检索分析[J].浙江工商大学学报,2014(05):26-34.

[5]丁晓.语料库AntConc软件对《推拿》的分析研究[J].现代语文(语言研究版),2014(08):122-124.

[6]尤作勇.世情景观的现代重述——论白先勇早期小说创作的“世情三部曲”[J].宜宾学院学报,2010(10):41.

[7]丁金国.语体风格分析纲要[M].广州:暨南大学出版社,2009.

猜你喜欢
白先勇分词语料库
分词在英语教学中的妙用
白先勇与《红楼梦》
《语料库翻译文体学》评介
旅美作家白先勇的家国情怀
白先勇:我有一颗天真的老灵魂
白先勇笔下女性形象分析
基于JAVAEE的维吾尔中介语语料库开发与实现
论英语不定式和-ing分词的语义传承
语料库语言学未来发展趋势