论基于语料库探究作家写作风格转变的可行性

2022-07-23 15:00周梦圆
参花·青春文学 2022年8期
关键词:语域语体语料

一、引言

语料库语言学是一种基于大量真实语料构建语料库对语言进行研究的学科。《语料库语言学》是一本介绍语料库语言学研究方法和语料库在各个语言研究领域应用实例的书籍,由美国语言学家Douglas Biber、Susan Conrad和Randi Reppen所著,刘颖和胡海涛翻译,2012年在清华大学出版社出版。该书从三大方面展开论述,即语料库语言学的介绍及研究方法、语料库在语言学各个研究领域的应用以及语料库语言学的方法论框架。基于语料库进行的语言研究分为词典编纂、语法研究、词汇和与语法的联结研究、语篇结构特征研究、语域变异、语言习得与发展以及语言的历时研究与风格研究七个部分。Douglas Biber等人在《语料库语言學》一书中提出了多种基于语料库进行语言研究的方法和实例。笔者在对该书的基本内容进行梳理和思考后,基于书中提出的“从语料库探究文本风格”的理论和方法,提出“基于语料库探究作家写作风格转变具有很强的可行性”,并以中国现当代作家余华前后三个时期的小说文本构建语料库,简要阐明基于语料库探究余华写作风格转变的研究方法和切入视角。

二、语料库语言学的介绍及研究方法

(一)语料库语言学的基本介绍

语料库语言学是一门以语料库为手段,研究语言的学科。相比于其他研究方法,基于语料库的语言研究主要采用定量和定性相结合的方法。语料库语言学研究涉及语料库的构建和对语料进行数据统计分析两部分。在语料库构建上,语料库的语料不是漫无目的、随意收集的,而是要在明确研究目的后,基于特定目的收集的。研究者可以根据研究课题的要求,采取科学的方法收集有代表性的语料,如比例抽样和分层抽样等。依据所代表媒体形式的不同和设计结构、语料来源、语料时效、语料处理方式的不同,语料库有不同分类。语料库的构建可以基于研究目的,自我设计构建,也可以借用数据库软件执行命令构建。在数据统计分析上,书中提出了频率统计标准化方法,即原始频率数÷该文本的词汇量×标准基数=标准频率(标准基数依文本的长短而定)。[1]因为当语料长度不同时,数据统计的原始频率是不可比的,需要通过标准化的方法对数据进行规整。不过,著者也说明了选取的基数越大,稀有的语言特征越会被放大,可能会产生一些误导性的统计结果。

(二)语料库语言学的研究方法

相比于传统内省式研究,语料库语言学依据大量文本语料,统计分析得出的结论更具科学性。一方面,因为语料库收集的语料范围广,根据大量文本归纳得出的结论同样也能应用到更广泛的文本分析中,结论适用度高;另一方面,也因为在进行语料分析时,通常会采用科学的统计软件,比如SPSS等。基于语料库的研究方法,将数据统计和内省分析有机结合,排除过多人为干扰的因素的同时,也兼顾了研究者的主观能动性。这种归纳法和演绎法并重的研究得出的结论,自然受到越来越多的人的认可和依赖。

三、基于语料库进行语言学研究

以语料库为基础的研究,几乎可以应用到语言学研究的各个领域,比如以词汇学和语法学为代表的语言本体研究,以及以社会语言学、语域、语言变异、语言教学和文体学等为代表的语言应用研究。主要从以下几个方面举例阐述基于语料库进行语言学研究的方法。

(一)基于语料库进行词典编纂

词典编纂是基于语料库探索语言使用特征所开发出来的一个语言学研究领域。本文认为,语料库语言学研究在词典编纂方面,有很高的理论价值和现实价值。基于大量语料,人们可以考察一个词汇在自然语境中的使用情况,统计分析其义项分布,区别出常用义项和不常用义项,进而在词典里对义项解释进行先后排列。利用相关软件,人们可以统计分析某个词汇在不同文本中的词频分布,编制某个文本的常用词表和不常用词表,这不仅有利于词典编纂,也有利于二语教学。在二语教学中,教师可以先从基于语料库统计制作出的常用词表出发进行教学,再过渡到用不常用词表进行教学,呈现出一种循序渐进的教学模式。基于语料库,人们可以统计出某个词汇的使用联结模式(即常用搭配),以及这些搭配适用的文本类型,从而掌握这个词在不同类型文本中的使用特征。还可以基于语料库对比某两个或某几个意义相同或相近的词语在不同类型文本中的使用分布,进而区分出同义词的使用差异,以及各自所适用的文本类型。以汉语表达为例,词语“或”“或者”“还是”“要么”作为连接词,都表示选择,虽然单凭语感,可以估计出这几个词在使用上存在差异,但是这个结论需要借助相关数据进行考证。在这种情况下,人们就可以收集包含这几个词的不同语域中的文本构建语料库,统计分析其常用搭配和义项分布,得出每个词自身的常用搭配、优先义项和适用语域。这项研究在丰富相关词典解释的同时,也能够帮助留学生在汉语学习中区别使用这类选择连词。

(二)基于语料库进行语域(语体)语法研究

语法是语言研究中不可或缺的重要组成部分,基于语料库的实证研究,还可以应用于语法研究中。相比于词汇研究在语料库语言学研究中的不断发展,基于语料库的语法研究尚处于发展阶段,有很大的研究空间。基于大量不同语域的文本构建语料库,研究者既能调查各种语法结构在不同语域中的频率分布,还可以研究这种分布和非语言因素间的关系,进而探索出在不同语域条件下,语法结构选择的规律和动因。著者提出基于语料库的语法研究可以从三个层次展开,即形态特征、语类和句法结构。

1.形态特征研究

该书考察了英语中的部分词缀在动词和形容词两个词类名词化过程中扮演的角色,也统计分析了不同语体风格中名词化词尾的分布和功能。虽然汉语相比于英语,形态变化少,但类比于此,本文认为,人们也可以构建语料库考察名词后接词缀在不同语体中的分布,如“子”缀和“儿”缀等,进而总结出其在不同语域中的使用特点和功能特征。

2.语类研究

该书选取名词、动词和形容词,并考察了其在三个不同类型语域中的频率分布,以此得出结论:在学术文章中,名词使用得多,在口语和小说中,偏向使用动词和形容词。这种基于语料库的语类研究,不仅能够清晰地呈现出不同词类的语域分布倾向,也能够在此基础上,依据词类分布,分析出不同语域的语言风格。本文认为,《语料库语言学》一书所举实例具有一定的代表性,但倘若要进行研究,还可以进一步拓展语域,如新闻报道、电视剧对白和科普文章等,也可以将目光转移到其他词类上,如虚词、量词、副词和连接词等。

3.句法结构研究

著者对比分析了两种具有相近意义的句法结构在不同语域中的使用分布,发现前者主要分布在口语性较强的文本中,而后者则多出现在书面语性更强的文本中。本文认为,也可以研究在不同语体中,同一种句法结构的使用差异,比如“被”字句在法律语体、学术论文、新闻报道和日常口语中的使用差异。

综合来看,基于语料库的语体语法研究,大有发展前景和研究价值。自从冯胜利(2006,2010)从韵律语法的角度研究书面语语法,并提出语体语法的概念后,[2][3]汉语语体语法的研究逐步得到大范围展开,如王永娜(2012)探究了“和”字动词性并列结构在书面语体中的构成机制等。[4]这些研究都表明了不同语体在语法结构使用上呈现出不同差异。伴随着语料库语言学在国内的发展,漢语语体语法研究也出现了一条新的研究路径,如刘艳春(2016,2019)基于大量语料构建语料库,利用多维度分析法对汉语在不同语体中的语篇进行数据分析和使用特征概括。[5][6][7]Douglas Biber等人在《语料库语言学》一书中提出的“基于语料库在语域中研究语法”的方法,能够为新时代的汉语语体语法研究提供新思路。

(三)基于语料库进行语域变异的多维度分析

在语言使用过程中,为达到不同交际目的,语言表达也会产生变异。Douglas Biber等人在《语料库语言学》一书中提出多维度分析法,用来研究不同语域中的语言变体。多维度分析法的提出为语料库语言学研究提供了新视野和新思路,是《语料库语言学》一书的重中之重。相比于研究单独的语言特征,多维度分析法,能够全面揭示出不同语域的语言特征,基于大量语料和数据软件归纳出的共现语言特征,有效避免了因个别反常现象而引起的结果误导。多维度分析法有以下操作步骤:收集所要对比研究的语体的大量代表性文本,构建一个囊括主要语言共现模式的语料库;根据不同语言表达在语篇中扮演的不同功能,提取归纳出所要研究的语言特征;利用计算机软件识别和计算每一种语言特征在各个文本中的出现情况;运用SPSS软件进行因子抽取,并统计归纳出语言特征的共现模式以及确定出研究文本的变异维度;利用因子分析法进行因子计算,得出每个文本在每种维度上的得分;基于每种语体在每种维度上的不同得分给出功能性解释。

四、基于语料库探究作家写作风格转变

基于多维度分析法,本文认为,不仅可以收集某个作家的某一类型的作品构建语料库,归纳出这个作家在这一类型文本写作中表现出的语言使用共现模式,进而总结出其在某个类型文本写作中的风格;同时,也可以大量收集某个作家不同阶段的作品构建语料库,统计分析其不同时期的语言使用的不同特点,归纳出每个时期的写作风格,探究其写作风格的转变。笔者研读《语料库语言学》一书后,认为可以基于Douglas Biber提出的“从语料库探究文本风格”的理论构建历时语料库,探究某位作家写作风格的动态演变。

以中国当代作家余华为例,王萍(2009:28)提出,余华小说文本的语言风格从《十八岁出门远行》和《四月三日事件》的怪异陌生化转向《活着》等作品的审美简化后,又进入《兄弟》之后的“语言狂欢期”。[8]可以选取初期的《十八岁出门远行》《世事如烟》和《四月三日事件》,中期的《活着》等和后期的《兄弟》(上下)小说文本,构建历时语料库。为不破坏小说的原有结构,避免因上下文不连贯,对小说风格造成误读,笔者建议,不随机截取相同数量的语料,而是将小说文本完整地呈现出来。因文本长度不同造成的误差,可以通过对数据进行标准化处理来规避。

研究可以从两方面出发。一方面,可以从计量语言学的传统研究角度出发,从词汇丰富度(型例比)、词汇多样性(单现词占比)、词汇密度(实词数/总词数)、关键词分布(利用AntConc的关键词表功能对比三个时期小说文本的关键词)分析小说叙事视角(人称代词)和题材内容(名词和动词等),以及文本复杂度(平均词长、平均句长和平均段落长度)等,探究其写作风格的变化。这种方法的好处在于,切入视角小,能够从多方面对比分析出余华小说在三个时期的写作风格特点,不足之处是,无法呈现出这三个时期的小说写作的共同特点。另一方面,也可以采用多维度分析法,提取三个时期的小说文本的语言特征,并总结出其语言共现模式,运用因子分析法确定分析维度并计算每个时期的小说文本在各个维度上的得分,进而对比分析三个时期的小说文本的各自风格倾向,由此探究余华写作风格的动态演变。多维度分析法是以三个时期的小说文本所表现出的共现语言特征确定共同的维度后,才在每个维度上进行对比分析的,相比于传统计量语言学的研究方法,这样既能展现出三个时期的小说写作的共同风格,也能够分析出它们在共同风格上存在的个体差异。

五、结语

《语料库语言学》一书从多个领域介绍了基于语料库能够进行的语言学研究,是一部实用的语言学工具书。研读完这本书后,笔者收获颇丰,感受最深的有两点:一是语料库语言学应用范围之广;二是数据标准化处理对于基于语料库的语言学研究非常重要。本文一边对《语料库语言学》的呈现内容进行梳理的同时,也结合汉语实际,提出了笔者的部分研究想法,这些想法有待在今后深入思考后操作成文,特别是最后提出的“基于语料库探究余华写作风格转变”的选题灵感。

参考文献:

[1][美]Douglas Biber,Susan Conrad,Randi Reppen.语料库语言学[M].刘颖,胡海涛.译.北京:清华大学出版社,2012.

[2]冯胜利.论汉语书面正式语体的特征与教学[J].世界汉语教学,2006(04):98-106+148.

[3]冯胜利.论语体的机制及其语法属性[J].中国语文,2010(05):400-412+479.

[4]王永娜.书面语体“和”字动词性并列结构的构成机制[J].世界汉语教学,2012,26(02):

188-197.

[5]刘艳春,胡凤国,赵艺.辩论与演讲语体多维度、多特征对比研究[J].语言教学与研究,2016(06):103-112.

[6]刘艳春.小说等四语体在语体变异模式中的定位与特征——基于17个语体的语体变异多维度考察[J].江汉学术,2019,38(01):106-112.

[7]刘艳春.汉语语体变异的多维度分析——基于17个语体72项语言特征的考察[J].江汉学术,2019,38(03):100-110.

[8]王萍.论余华不同时期小说的语言词汇策略[J].山东教育学院学报,2009,24(01):28-31.

(作者简介:周梦圆,女,硕士研究生在读,中国传媒大学人文学院,研究方向:应用语言学)

(责任编辑 刘月娇)

猜你喜欢
语域语体语料
汉语语体语法研究综述
言语交际中语体的得体性探讨
可比语料库构建与可比度计算研究综述
语体变异的社会语言学研究路径、热点与趋势
中小学语文教学中语体意识的思考
中古汉语分期研究所涉及的语料问题
如何使用第二外语学习者语料
科技术语的语域传播论纲
语域下土木工程英语词汇文体特征
基于语料库的近义词辨析