张爱玲和王安忆小说的计量统计和分析

2019-04-21 08:52杨晨
文教资料 2019年36期
关键词:王安忆张爱玲

杨晨

摘    要: 本文以张爱玲和王安忆的各三部小说作为语料,选用段落、句子和分句的长度,叠词、颜色词和包含上海元素词语作为特征,使用SPSS相关分析和聚类分析判断两位作者的作品的异同。该文发现张爱玲和王安忆都善于使用叠词和颜色词,都通过细腻的女性笔触,描写上海的传奇故事。

关键词: 计量风格    张爱玲    王安忆    层次聚类

1.引言

张爱玲,1920年生于上海,先后创作了《倾城之恋》《金锁记》《红玫瑰与白玫瑰》等小说和大量散文、电影剧本、学术论著和翻译作品。王安忆,1953年生于江苏南京,一岁时随父母迁居上海,先后创作了《长恨歌》《黄河故道人》等长篇小说和大量小说集、散文和文论集。尽管两人相隔近半个世纪,却都有着久居上海的生活经历,成长背景相似,创作主题以都市小说为主,都以描摹女性人物见长。

已经有很多学者对二人进行对比研究,但大多集中在都市小说创作的比较研究,尤其是上海都市书写的比较研究,以及作品中的女性人物形象研究。同时,这些研究都采用了传统的内省式方法,对二者语言风格的客观对比目前还是一片空白。因此,作者希望从计量风格学的角度对两人的文学语言进行研究。

计量风格学区别于传统风格学,不以个人阅读体验为依据,而转向客观方法来分析写作风格。在中文文本领域,通常会提取文本层面的词长、句长、段长,词汇层面的词类、词汇丰富度、高频词等。再通过统计学方法来判断不同作者之间是否存在差异,最后分析这些数据体现了文本什么样的风格差异。

2.语料库和预处理

本文选择张爱玲及王安忆的三部小说为研究语料,并为了在图表中方便表示进行编号。首先对文本进行预处理:删去章节号、标题、前言与后记。再使用NLPIR汉语分词系统对文本进行分词,并据此统计语料库中字、词、标点的数量和句子、段落的长度,见表1,表2。

表1    语料库字、词情况

表2    语料库段落、句子及分句情况

3.段落、句子和分句

在语料预处理时已经统计了六部小说的段落、句子和分句的数量、均值和。通过数据能够发现,张爱玲小说的平均段落长度明显大于王安忆小说,二者在段落平均句数和平均分句句长差别不大。张爱玲小说平均段落长度大于王安忆的原因是张爱玲小说段落中有更多的句子。张爱玲小说这种更长的段落降低了文本的易读性,需要读者花费更多的精力在文本阅读上。

另一方面,作者利用SPSS对表2的语言特征进行相关分析,相关系数的大小表示相关程度。相关系数最早是由统计学家Pearson提出的,目前最常用的相关系数就是皮尔逊(Pearson)相关系数,在使用SPSS进行简单相关分析时所计算出来的相关系数就是皮尔逊(Pearson)相关系数。相关系数一般用r表示,r值有正负之分,正值表示正相关,负值表示负相关。判断相关性强弱时我们考虑的是r的绝对值,绝对值越大,相关性越强;绝对值越小,相关性越弱。其相关性的强弱判断如下所示:

取绝对值后,若相關系数r<0.09,则认为变量之间没有相关性;若相关系数在0.1-0.3之间,则认为变量之间的相关性弱,几乎可以认定为没有相关性;若相关系数在0.3-0.5之间,则认为变量之间具有中等相关性;若相关系数在0.5-0.8之间,则认为变量之间具有较强的相关性;若相关系数r>0.8,则认为变量之间具有很强的相关性。

输出结果如下图所示:

观察数据可以发现,平均段落长度的r值为0.236,即张爱玲和王安忆在段长上存在显著差异。

4.词汇的定量分析

4.1词汇丰富度

词汇丰富度是描绘文本中作者用词的重要维度,主要用类符形符比(Type-Token Ratio, TTR)来表示。所谓类符(type)是文本中所有出现的词汇的类数,相同的词记为1个;形符(token)是文本总词数。但是,通常一个作者在写作时使用的不同词汇数量是一定的,而随着文本的增长,总词数在不断增加,所以文本越长,对TTR的结果影响越大。因此,本文采用Guitaud提出的修正公式,取形符的平方根作为分布计算词汇丰富度,公式如下:

具体统计情况如下表所示:

为了便于观察,将由此得到的张爱玲、王安忆修正类符、形符比绘成折线图,可以看到除了Z1的词汇丰富度大于W1,王安忆小说的词汇丰富度略大于张爱玲。因此,在下文,我们挑选几个有代表性的用词习惯进行对比分析。

4.2重叠式

音乐性是张爱玲和王安忆语言艺术特色之一,反映在语言文字字上就是重叠形式的使用。重叠形式的巧妙运用可以增强语言的韵律感、节奏美。检索六部作品的重叠形式,统计结果如下:

观察数据,可以看出张爱玲的叠词使用频率明显高于王安忆,利用索引工具,我们发现,二人使用了大量的重叠且形式丰富多样。从表达效果上看,重叠形式可以使文章形式整齐,写景状物时增强语言的表达能力,渲染气氛时营造出绵远悠长的艺术效果,读起来朗朗上口。

天就快亮了。那扁扁的下弦月,低一点,低一点,大一点,像赤金的脸盆,沉了下去。天是森冷的蟹壳青,天底下黑魆魆的只有些矮楼房,因此,一望望得很远。地平线上的晓色,一层绿,一层黄,又一层红,如同切开的西瓜,是太阳要上来了。渐渐马路上有了小车与塌车辘辘推动马车蹄声得得。卖豆腐花的挑着担子悠悠吆喝着,只听见那漫长的尾声:“花……呕!花……呕!”再去远些,就只听见:“哦……呕!哦……呕!”(《金锁记》)

这一段描写用了“扁扁”“黑魆魆”“辘辘”“悠悠”等重叠形式,生动地勾勒出黎明破晓前街道的景象,“辘辘”“得得”的叠音词使用更是增强了画面感,形象地描绘出街道由平静转向喧闹的场景,具有动态感,使人声临其境。

猜你喜欢
王安忆张爱玲
中秋
九月雨
悲剧与救赎——谈王安忆“三恋”中的女性救赎之路
梦里梦外——评张爱玲《天才梦》
王安忆小说病象报告
聆听流行歌中的张爱玲
张爱玲:生命如奇服一样斑斓
穿越历史时空的“道同”——论王安忆小说中的自然主义情怀
王安忆笔下的男性形象