基于语料库的批评话语分析

2011-08-04 08:41
天津外国语大学学报 2011年5期
关键词:语料语料库研究者

郭 松

(天津商业大学 外国语学院英语系,天津 300134)

一、批评话语分析的特点及局限性

批评话语分析(critical discourse analysis,CDA)旨在研究话语、权力与意识形态之间的关系。它视话语为一种社会实践,话语不仅反映社会现实,而且建构社会主体、社会关系、知识和信念体系。研究者认为,对于世界的任何表述都是基于一定的意识形态立场,文本中的意义之争就是社会中的权力之争。因此,“批评话语分析不是单纯对文本进行客观描述,而是通过这种描述揭示文本中隐含的、人们习以为常的意识形态意义”(田海龙, 2009: 65)。他们也毫不掩饰自己的政治立场,公开表明自己的动机是帮助被统治与被压迫群体,批评的最终目的是为了改变社会中的不平等现象,促使社会变革。van Dijk(1993: 253)指出,任何批评本质上预设着价值评判标准,批评话语分析家必须是社会活动家。

与其他传统话语分析、篇章语言学研究方法不同,批评话语分析不仅研究话语、篇章本身,而且重视话语实践过程及其社会语境分析,注重从社会制度和社会构成方面来寻找解释话语的原因。话语活动并非发生在真空之中,而是产生于社会团体与复杂的社会结构的互动之中。因此,如果我们想理解话语及其效果,就不能不考虑话语出现的语境。“话语的生成离不开语境,不考虑语境就无法理解话语……只有我们考虑到话语使用的具体情景,只有了解了其背后的惯例和规则,只有认识到它们内嵌于特定的文化和意识形态中,而且最重要的是只有当我们知道话语与过去的什么相联系,话语才有意义。”(Fairclough &Wodak,1997: 276)正因为如此,长期以来批评话语分析一直以定性研究为主。它的创始人之一Fowler(1991:68)就曾说,批评性的解读需要研究者具备历史知识与敏感性,人类而不是机器才可以拥有它们。

这种定性研究方法因偏重主观性和缺乏代表性而遭到部分学者的批评。Stubbs(1997:106)认为,批评话语分析的材料十分有限,几乎没有讨论过局限于短小语料片段的分析是否充足,应该如何筛选语料,语料是否有代表性,对语料片段的分析没有任何关于其代表性的说明。Widdowson(1995: 169)也对语料的代表性提出了质疑,认为从特定视角所作的阐释有些偏颇。因为它带有意识形态倾向,选择分析的是语篇中能够支持观点的那些特征。为了回应这一质疑,一种基于语料库的批评话语分析新模式开始出现。批评话语分析不应局限于对文本片断的分析,而应在大规模抽样调查的基础上得出关于典型的语言使用情况的一般性结论(Stubbs, 1997: 109)。

二、语料库研究与批评话语分析的结合

作为一种经验的方法,语料库为语言研究带来了实证和量化两个标志性特点。语料库研究采用的是一种自下而上的基本研究方法,在分析大量真实语言材料的基础上获得相关量化数据,进而分析和研究语言系统的规律。因此,语料库研究也常被称为基于频数的研究(frequency-based study)或概率驱动的研究(probability-driven study)。语料库的定量分析为研究提供了坚实的数据基础,从而有助于克服研究者本人的主观性和片面性,语料的丰富性也减少了研究者选择分析对象的随意性,增强解释的说服力。“语料库软件以一种不同寻常的方式来呈现语言,这往往能够使研究者去发现一些经常被忽视的语言型式(patterning)。”(Hunston, 2006: 234)

批评话语分析视文本为话语实践留下的痕迹,“文本被当做话语的一个向度——在形式上表现为话语的物质性存在,在观念上则是一定语境的体现”(胡春阳, 2007: 36)。它从具体的文本分析出发去寻找研究社会问题的突破点,以追寻意义与权力斗争的轨迹。因此,批评话语分析与语料库研究一样,具有浓厚的经验主义色彩。研究者在使用语料库的过程中并不是对所有的语言型式都饶有兴趣,而是注重研究那些因不断重复而表现出显著性的语言型式,以便了解话语参与、构建社会现实的运作机制及其意识形态意义。语料库分析工具的使用可以帮助研究者轻松地锁定这些语言型式,从而将他们从大量的数据整理分析工作中解救出来。这些语言型式具有十分重要的意义,它们可以被用来说明某种霸权话语(hegemonic discourse)的存在或是人们认识世界的某种常识性看法。“反复出现的模式表明评价意义并不仅仅是个人独有的,而且为广大言语社区所共同拥有。一个词、短语或结构就可能激发一种文化定势。”(Stubbs,2001: 215)不仅如此,语料库还可以使研究者发现一些反例的存在,而这些反例不大可能在小规模的研究中被发现。当我们在某一个文本中发现了对抗性话语(resistant discourse),我们有可能把它错认为是霸权话语(Baker,2006: 14)。语料库的使用可以拓展研究者的视野,让他们发现更多的语言现象,挖掘更多的语言事实。语料库技术可以帮助研究者发现更多的例证,也可以帮助研究者注意到以前从未认识到的语言现象。语料库技术的使用可以用来巩固、驳斥或修正研究者的直觉,让他们知道自己的观点在多大程度上是有事实根据的(Partington, 2003: 12)。

本文选取的语料为英国石油公司(British Petroleum,以下简称BP)高管于2006至2010年期间有关能源问题的演讲,由40个文件组成,含127 479个形符(tokens)和6 987个类符(types),经过削尾处理(lemmatization)后剩下5 198个原形词(lemmas)。本研究所使用的语料库软件为AntConc 3.2.1。

词频统计是语料库研究中最基本的统计手段,它可以使研究者注意到语言的显著特征。该语料中频率最高的前15个词(见表1)中除了have既是实词又是功能词外,其余13个是功能词,只有一个实词,即energy。功能词主要表达语法意义,数量十分有限,因此在实际语言应用中重复率很高。唯一入围的实词energy是本语料的关键词,反复使用也在情理之中。为了更好地了解该语料所表达的概念意义,我们进而对实词进行了考察(见表2)。紧随energy之后的是gas与oil,它们作为energy的下义词体现了同样的概念意义,表明了该语料的主题。结合对表2中其他高频词的索引行分析,我们对该语料所表达的基本观点也有了大致的了解。能源问题是全世界所共同面临的问题,能源消耗中排放的二氧化碳和全球气候变化紧密相关,必须发展新能源以及进行技术革新来保持世界的可持续发展,而BP正是这方面的典范和领军人物。

表1 前15个高频词

表2 前15个高频实词

10 380 price 11 367 bp 12 366 supply 13 358 demand 14 317 global 15 316 change

词汇的搭配强度有助于找出单词的共现趋向。计算搭配强度的方法主要包括互信息值(MI值)、Z值、T值、log-log值等,这些方法各有优劣,在此不赘述。AntConc可以提供前两者的计算数据,本研究采用的是T值。以BP作为节点词(node),将跨距(word span)设为左2右2, 最后计算出T值最高的前10个词(见表3)。在本语料中,BP与人称代词we的搭配力最强,we的频数为50次(12次出现在BP的左边,38次出现在BP的右边),T值为6.402 95。通过考察BP与we共现的索引行,可以发现其出现的基本模式为in/at BP we以及we at/in BP,这正是in和at高居BP搭配词第二、三位的原因。为了获取更多关于BP, we, in/at共现的数据信息,可以对BP的词丛(cluster)进行考察。将词丛限定为3,经过统计可以发现,以上三个单词共现的频率要远远高于其他三词词丛(见表4)。

表3 BP的搭配词分析

表4 BP的三词词丛

we, at/in, BP的不断重复具有显著的统计学意义,它们表达了怎样的暗含意义呢?这里我们重点关注对we的表述,即“我们(BP)”到底做了什么。通过对相关索引行的分析(见表5),我们发现大多数情况下we后面会出现work hard, take significant action, reducing emissions, prepare等表示积极意义的词汇,也就是说,we这样一个中性词被赋予了积极的语义韵(semantic prosody)。通过这种方法,演讲者成功地将BP的价值观念传达给了他人,塑造了良好的自我形象,即负责任,锐意进取,积极采取措施(技术革新、寻找清洁能源)来迎接挑战等。

表5 we, at/in, BP三词词丛的索引行

众所周知,石油企业具有高耗能、高污染等特点,而BP又是如何看待环境议题的呢?通过对environment的索引行分析(见表6),可以发现其搭配词主要有protect, no damage,benef i t, positive, clean, less harmful, respect等。在整个语料库中,environment一共出现了80次,但是与其搭配的词中却没有一个消极词汇,这不能不引起我们的深思。石油企业对环境的影响没有被提及,并不意味着石油企业对环境没有破坏作用,情况正好相反。当今不管是发达国家还是发展中国家,环保、绿色的概念越来越深入人心。企业作为盈利的主体自然会去顺应它们的上帝——顾客的诉求,会不遗余力地推销自己的绿色形象,即绿色营销。BP在这场绿色大潮中自然不甘示弱,极力去“漂绿”(greenwash),渲染自己对环境友好的一面。绿色和平组织(Greenpeace)活动家Greer和Bruno(1996: 11)一语中的,“破坏臭氧层的公司领导人因成为保护臭氧层的领导者而受到赞扬;大型跨国石油企业对全球变暖采取了‘预防性’措施;生产危险农用化学品的公司暗示它们正在帮助那些饱受饥饿的人们”。

表6 environment的搭配词分析

语料库的使用可以有效帮助批评话语分析研究者弥补单纯依靠直觉的缺陷,同时避免迷失在浩如烟海的文本数据之中。但从目前的研究状况来看,语料库的应用仍然存在较大局限。

语料库注重文本分析,着重分析人们实际说了什么,而人们没有说什么同样值得研究。人们所使用的语言在传递新信息的同时包含了大量未言明的已知信息,即预设(presupposition)。话语就像冰山,表达出来的只是一小部分与语境相关的具体知识,而未被表达但却被预设的共享的社会文化知识在数量上远远超过了被明确表达的(van Dijk,2009: viii)。这些预设以常识的形式存储于人们的大脑之中,很少受到人们的注意或质疑。因此,Fairclough (1992: 87)指出,意识形态通过自然化的方式转变成非意识形态的常识时最有效。批评话语分析的任务之一就是使这些人们习以为常的观点、价值观非自然化(denaturalization)、透明化。这些预设嵌入在人们的常识之中,常常不言而喻,很难单纯依靠语料库技术手段进行统计。因此,语料库分析必须结合研究者的直觉和对话语的认知,时刻保持对文本中缺失信息的警惕。与标准语料库进行对比也有助于研究者去发现其独特的文本型式,从而使那些人们习以为常的观点与表达凸显出来(Baker, 2006: 19)。

语料库分析基于概率统计之上,频率越高越重要,越值得研究。而重复出现的语言并不一定隐含着霸权话语。语言本身并不具有权势,之所以获得权势是因为具有权势的人在使用。也就是说,语料库中的文本或说话者彼此之间的权势并不是均衡分布的,美国总统的一次演讲要比普通民众对同样话题的千百次讨论重要。研究者不仅要注意文本中出现了谁的声音,而且要注意这些声音是如何被纳入到议事框架之中的。Talbot(2007: 75)指出,有时在媒体上允许他人为自己辩解也是批评他们的一种有效方法。在分析有关穆斯林报道的过程中,Talbot发现穆斯林的声音反复出现在报道之中,但这不意味着穆斯林民众的声音得到了重视,更有权势。通过分析可以发现,这些被引用的穆斯林民众的观点极端,咄咄逼人,引用越多越会引起读者的反感。由于语料库方法更偏重反映文本的形式特征,而对内容重视不足,研究者需要根据目的对语料进行适当地标注(文本出处、语义等),以有效地解决这一问题。

随着话语分析领域的进一步发展,话语的概念早已超出了文字的范畴,进而包括图像及其他表意符号。Kress 和van Leeuwen (2006:4)指出:“视觉结构并不只是对‘现实’结构进行复制。恰恰相反,它们生成的现实世界的各种图像,与那些生成、传播和阅读这些图像的社会机构的利益是紧紧联系在一起的,它们是表达意识形态的。视觉结构绝不只是形式的,它们在语义上也是非常重要的。”(朱永生 , 2007: 85)van Leeuwen(2008: 149-161)就探讨了玩具作为符号资源在表征社会角色与社会身份中的作用。在数字信息时代,声音图像技术获得了前所未有的重视,越来越多的研究者注意到了文字文本与其他形式文本之间的互动关系。但目前还缺乏有效、统一的技术手段将多模态话语整合到语料库之中,开展大规模的多模态话语研究仍然困难重重。

三、结语

尽管语料库技术在批评话语分析中的应用还面临着种种困难与局限,但其作用与有效性已经凸显,为批评话语分析的进一步发展提供了一种全新的研究思路。与此同时,我们也应注意到语料库提供的数据可以辅助人们的语言直觉和内省判断,但是绝对代替不了人们的判断。数据如果离开了研究者的阐释,将不具有任何意义。因此,“完整的、合理的基于语料库的话语研究都要包含研究者定性的、阐释性的概括及分析”(梁茂成、李文中、许家金,2010: 214)。事实上,研究者在选择语料、建库、确定研究重点等时,无不预设着判断,受到自身研究兴趣和目的的影响。“纯实证主义科学只限于所谓的‘客观’描写和呈现‘事实’,但忽视了这样一个简单的事实,即科学是由科学家来研究的,而科学家跟任何其他人一样具有自己的观点、兴趣和意识形态。”(辛斌, 2005: 1)因此,语料库的使用并不是旨在使批评话语分析纯粹客观化,但是它却可以在最大程度上减少研究者的偏见,提高分析的置信度。

[1]Baker, P.Using Corpora in Discourse Analysis [M].London: Continuum, 2006.

[2]Fairclough, N.Discourse and Social Change [M].Cambridge: Polity Press, 1992.

[3]Fairclough, N.& R.Wodak.Critical Discourse Analysis [A].In T.A.van Dijk (ed.) Discourse as Social Interaction [C].London:Sage, 1997.258-284.

[4]Fowler, R.Language in the News: Discourse and Ideology in the Press [M].London: Routledge, 1991.

[5]Greer, J.& K.Bruno.Greenwash: The Reality behind Corporate Environmentalism [M].New York: Apex Press and Third World Network, 1996.

[6]Hunston, S.Corpus Linguistics [A].In K.Brown (ed.) The Encyclopedia of Language and Linguistics (Vol.3) [Z].Oxford:Elsevier, 2006.

[7]Kress, G.& T.van Leeuwen.Reading Images: The Grammar of Visual Design [M].London: Routledge, 2006.

[8]Partington, A.The Linguistics of Political Argumentation: The Spin-doctor and the Wolf-pack at the White House [M].London: Routledge, 2003.

[9]Stubbs, M.Whorf’s Children: Critical Comments on Critical Discourse Analysis [A].In A.Ryan & A.Wray (eds.) Evolving Models of Language [C].Clevedon: Multilingual Matters, 1997.

[10]Stubbs, M.Words and Phrases: Corpus Studies of Lexical Semantics [M].London: Blackwell Publishing, 2001.

[11]Talbot, M.Media Discourse: Representation and Interaction [M].Edinburgh: Edinburgh University Press, 2007.

[12]van Dijk, T.A.Principles of Critical Discourse Analysis [J].Discourse & Society, 1993, (2): 249-283.

[13]van Dijk, T.A.Society and Discourse: How Social Contexts Inf l uence Text and Talk [M].Cambridge: Cambridge University Press, 2009.

[14]van Leeuwen, T.Discourse and Practice: New Tools for Critical Discourse Analysis [M].Oxford: Oxford University Press, 2008.

[15]Widdowson, H.G.Discourse Analysis: A Critical View [J].Language and Literature, 1995, (3): 157-172.

[16]丁峻.基于语料库的美国总统就职演说研究[J].天津外国语学院学报,2008,(2):25-31.

[17]胡春阳.话语分析: 传播研究的新路径 [M].上海: 上海人民出版社, 2007.

[18]梁茂成, 李文中, 许家金.语料库应用教程 [M].北京: 外语教学与研究出版社, 2010.

[19]田海龙.语篇研究: 范畴、视角、方法 [M].上海: 上海外语教育出版社, 2009.

[20]辛斌.批评语言学: 理论与应用 [M].上海: 上海外语教育出版社, 2005.

[21]朱永生.多模态话语分析的理论基础与研究方法 [J].外语学刊, 2007, (5): 82-86.

猜你喜欢
语料语料库研究者
高等教育中的学生成为研究者及其启示
《语料库翻译文体学》评介
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
基于语料调查的“连……都(也)……”出现的语义背景分析
基于COCA语料库的近义词辨析 ——以choose和select为例
医生注定是研究者
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法