算法批评视域下文学批评的分歧与融合

2023-02-08 01:14
云南社会科学 2023年5期
关键词:文学批评文本算法

李 阳

依托于数字人文(Digital Humanities),以算法批评(Algorithmic Criticism)为代表的量化研究逐渐凸显其力量,并与文本细读的阐释传统形成了看似不可调和之势。很多研究者将两种文学批评模式的不可调和追溯到人文学科和自然学科中“人文范式”和“科学范式”本身的不可兼容性,也代表着质性研究和量化处理、主观与客观、审美和经验之间的差异,由此衍生出了褒扬和批判之声。褒扬之人如苏珊•哈琪(Susan Hockey)认为,相较于某些批评方法,数字人文视域下的算法批评可以加强对文本的理解,矫正某些批评家的个人阐释。而批评之人如霍尔(Gary Hall)则认为这不过是“从事幼稚而肤浅的学术工作的借口”①Gold,M.K.(2012).Debates in the Digital Humanities.Minneapolis: University of Minnesota Press.。相较于以上两种截然相反的态度,也有学者认为两种分歧仍然具有可以融合,或者应该融合之处。如C.P.斯诺(C.P.Snow)相信“人文科学和硬核科学的不同方法论和知识传统可以而且/或应该趋同”②Thaller,M.(2012).Controversies around the Digital Humanities: An Agenda.Historical Social Research,37,7-23.。笔者认为,传统文学批评方法③传统批评方法指的是已经经典化、知识化和结构化的批评范式,如心理分析、女性主义、后殖民主义、性别研究等,它背靠着定性研究的传统。和算法批评确实存在分歧和冲突,但二者也应存有可以融合之处,融合之处正是跨学科研究的依据和阵地所在。

一、算法批评的缘起和流变

(一)算法批评的历时发展

在文学研究中,算法批评(Algorithmic Criticism)是计算机算法和文学批评相融合的跨学科研究范式,其基本含义是以计算机的算法功能进行文学批评实践,对作品的量性和结构性关系进行考察。从历史形成角度,算法批评经历了无意识至有意识阶段,中间也包含着“他觉”与“自觉”的交织,整体上呈现出人为计算主体至计算机为算法主体的过渡。(1)人为计算主体的批评阶段:指无意识地将文学文本看作语料,对某一关键词出现的位置、数量、结构和规模进行分析,并联系文本进行阐释。如不同时代的批评者在对曹雪芹的《红楼梦》进行意象分析时,基于自身的计算本能,已然能够觉察到“梦”出现的频次和位置的特殊性,再结合文本的历史背景和自身的批评经验,总结出“梦”的意义包括贾宝玉的“云雨之梦”、功名利禄的“黄粱一梦”、虚虚实实的“人生如梦”等。无意识之处体现在,从将文本看作承载“开端—高潮—结局”的“叙事话语”转而看作是以待计算的语料,以模糊的、非算法经验的方式进行词频的计算。算法研究的“他觉”与“自觉”相交织。“他觉”指的是其他领域研究者以算法切入文学研究。如语言学学者基于计算机科学和数学算法开始将文学文本做成语料库,相继出现了“计算文体学”“计量文体学”“统计文体学”等基于计算机“文本聚类和分类”的研究分支,其中也包含作品与作家语言面貌的分析。如19 世纪,T.C.门登霍尔(T.C.Mendenhall)通过词频计算对比分析了狄更斯和萨克雷的创作风格。20 世纪80 年代,对古典文学进行语料库转换的“帕尔修斯项目”被设想和开展。“自觉”则是立足于文学本体对算法觉察并进行有意识地研究。后现代主义叙事学家马克•柯里(Mark Carrie)曾在叙事话语的研究中评价文学的定量研究:“计算文体学并不问诸如‘爱玛可爱吗?’之类的问题,而像问‘在康拉德的《黑暗之心》中like 这个词出现了多少次?’”①[英]马克•柯里:《后现代叙事学理论》,宁一中译,北京:北京大学出版社,2003 年,第29 页。也就是说算法批评分析语言出现的次数与人物意识、文本阐释之间的关系。意大利耶稣会罗伯特•布萨(Roberto Busa)与IBM 合作,对圣徒托马斯•阿奎那(Thomas Acquinas)多达1100 多万字拉丁文《托马斯著作索引》编制了索引。自此,文学批评者更加自觉地将量性关系纳入文学研究的范畴内。“自觉”与“他觉”的交织使得文学与其他学科的交流互动愈加频繁。(2)“计算机”算法批评的进一步发展阶段:随着计算机和互联网技术对大数据管理应用的成熟,促使“算法”研究形成一股重要的力量。此时,算法批评围绕着计算机为核心展开,主要在批评媒介、批评实践和批评结果三个方面贯穿算法,包括文学数据库的建立、计算机算法批评实践、可视化系统下批评结果的呈现等过程。从批评媒介的角度来看,文学数据库的建立将承载符号的物质化实在转向数据化虚在,脱实向虚的媒介变更让符号具有了实现算法的基本前提。从批评方法的角度来看,通过将文本看作确定性的语言总集,以计算机对关键词识别和提取,以算法对文本数量和结构关系,对不同文本之间的互文性、作家身份等进行分析。从批评结果呈现的角度来看,传统的批评依托于“话语的再现”完成其实践过程,而算法批评多以可视化系统完成数据的输出,以“数与图的再现”来凸显量性、位置和结构关系。与此同时,计算过程中算法对阐释的主导问题逐渐凸显。

(二)“算法批评”的典型论述

对“算法批评”进行较为详细论述的代表学者是斯蒂芬•拉塞姆(Stephen Ramsay),其代表作《算法批评》(Algorithmic Criticism)中几个基本观点如下:其一,数字人文是算法批评得以展开的基本背景。拉塞姆明确说明,与其他跨学科研究领域相同,数字人文促进人文科学与计算机科学之间发生革新和对抗,导致二者范式的破裂,其研究方法在社会融合中不断发生形态的变化。宏观的变化也牵动文学批评将计算机的算法功能纳入研究的范畴,延续原本就已然存在的计算批评传统。其二,算法批评可以起到继往开来的作用。拉塞姆追溯了算法批评的研究历史,分析了当下的研究现状。他指出以计算机进行文本分析的传统有将近六十余年的历史,其中文本风格(style)、作者研究(authorship)、对比研究(comparative analysis)都是较为成熟的研究领域。而当下互联网时代,计算文本的研究范式在自然语言进程(natural language processing)、数据计算(statistical computing)和人工智能(artificial intelligence)方面均有很大潜力。其三,算法批评的核心是围绕文学数据库中的数据进行计算而展开。算法批评的底层逻辑是将文学文本看作数据,通过计算机的计算功能对数据进行统计,并用某种算法进行词频计算,以实现对文本的解读。其四,算法批评具有能为和不能为之处。从实际应用的状态来说,算法批评可以用数据验证人类假设,其数据事实确实具有抵抗主观判断的功能。但算法批评也因局限文本资料,被质疑只关注文本本身,对文学语言整体性的偏信,以及对作者意图和读者阐释的忽视。在拉塞姆的眼中,算法批评有待实现认识论上的转变。

除了拉塞姆对算法批评进行过较为集中的论述,其他数字人文工作者或是直接或是间接地对“算法批评”及其内涵进行过讨论。如对算法批评背后的人文计算、计算机和数字人文之间关系的讨论:“当下的数字人文学科源于人文计算的60 多年传统,并且在某些方面仍然延续,从20 世纪中叶大型机的词汇和语言工作开始,一直持续到该世纪末互联网和万维网的诞生。数字人文的关注点将注意力集中在对文化遗产、汇总档案的数字化上。”①Jones,S.(2014) .The Emergence of the Digital Humanities.New York and London: Routledge.安妮•伯迪克等人说到:“数字活动的第一阶段,主要是对文本和数据进行排序、搜索、计算和匹配等基本操作。……这些标签的插入,意味着可以对解释的内容和展开的方式进行操作。”②[美]安妮•伯迪克等:《数字人文:改变知识创新与分享的游戏规则》,马林青、韩若画译,北京:中国人民大学出版社,2018 年,第17 页。马克•维泽(Mark Weiser)早在1991 年就在《科学美国人》(Scientific American)中提出“普适计算”(pervasive 或ubiquitous computing)③普适计算的不同英文名是对其不同特点的强调。pervasive 一词更强调计算对日常生活的嵌入性,ubiquitous 强调计算的普遍性。,“强调把计算机嵌入到环境或日常工具中去,让计算机本身从人们的视线中消失,让人们注意的中心回归到要完成的任务本身”④徐光祐等:《普适计算》,《计算机学报》2003 年第9 期。。亚当•格林菲尔德(Adam Greenfield)也提出了“普适算法”(everyware)指的是“无处不在或普适的计算已经在2005 年左右形成一种范式的转变”⑤Greenfield,A.(2006) .Everyware: The Dawning Age of Ubiquitous Computing.Berkeley,CA: New Riders.。以上论述也表现出互联网科技的背景、文本的数据化,计算与算法⑥算法指的是用于计算的方法,是解决问题的步骤和规范,在计算过程中起到主导作用,在计算机端以“数据结构+算法=程序”为构成。计算是按照算法进行的运算,得到数量结果的过程,二者不能分而用之。实际上,文学批评史中“计算批评”到“算法批评”的更迭表现出批评者从对计算结果的关注转向对计算方法的关注,二者都指向定量的文学批评范式。内涵的互相渗透,共同指向计算机算法设定及数据计算的定量研究范式。

对传统的文学批评方法来说,算法批评既像一个批评的内部成员也像一个外来者。因为算法批评承载着计算批评的传统,又与计算机技术进行新的合作,为传统批评方法注入了新的力量。因此,当下算法批评的意义源自跨学科的居间所带来的新视角,正因为是外来的,在一定距离之外,才会成为传统文学批评的一面透视镜。它也提供一种不同价值,能唤醒一种新的批评意识,能够给批评者带来用数量关系“体验事物自身的那种明晰,或体验事物之本来面目的那种明晰”⑦[美]苏珊•桑塔格:《反对阐释》,程巍译,上海:上海译文出版社,2011 年,第15 页。。但也正因为算法批评在科学和人文之间居中,其跨学科属性带来了研究的模糊和阈限,使得很多核心概念的归总出现难以调和之处。

二、传统批评与算法批评的冲突和分歧

(一)传统批评与“算法批评”的表象分歧

从长久的争论历史看,传统批评方法和算法批评的分歧有表隐之分。表象区别清晰地表现在批评媒介的数据化、批评实践的算法化、批评结果的可视化。隐性之处表现在“因果逻辑”典型与“大数定律”典型的差异,也切合着阐释客观主义和主观主义、语言“自明性”的历史性争论。

1.批评媒介的数据化。它的涵义指的是文学文本从印刷媒介转变到数据媒介的过程。安妮•伯迪克曾说:“人文主义之势的现代概念是建立在创作、叙述和印刷媒介组成的文本模型之上的。”⑧[美]安妮•伯迪克等:《数字人文:改变知识创新与分享的游戏规则》,第5 页。而数字人文的概念则建立在文本的数据化之上。从文学批评的角度来说,承载符号的批评媒介正从实体转向虚体,形成大数据的积累(accumulation of data)。当文本以数据的方式存在于互联网时,编码方式的改变导致文本既可以被粘贴,文本与文本之间又能以超链接的方式跳跃。特别是文学的数据库被不断地建立,进一步实现了对文本语句的提取和整合。比较典型的系统有 Infonetware Real Term Search,基于 Java 的开源Carrot2 搜索结果聚合聚类引擎 2.0 版,它“可以自动把自然的搜索结果归类(聚合聚类)到相应的语义类别中,提供基于层级的、同义的以及标签过滤的功能”①姚清耘、刘功申、李翔:《基于向量空间模型的文本聚类算法》,《计算机工程》2008 年第9 期。。如北京大学“吾与点古籍整理系统”,它通过计算机极高的处理速率和响应速率,对文本进行处理,进而实现字句识别、自动断句等功能。由此可见,批评媒介的数据化是激发算法批评的重要力量,更迭了原有的话语结构。

2.批评实践的算法化。传统文学批评实践多基于文本细读的方法,在考察量性关系时,批评者本人承担计算和批评的任务。但是算法批评下,批评过程发生了解离,分解成以计算机主导的“算法阶段”和以人为主导的“批评阶段”,人和计算机共同负责阐释结果。在计算机主导的“算法阶段”,由于海量的数据远超人的计算能力,也由于计算机、数学和人文学科之间的知识壁垒,传统的人文学科研究者很难插手到算法建构和数据计算之中。如拉塞姆在研究弗吉尼亚•伍尔夫 (Virginia Woolf) 的小说《浪潮》(The Waves)时,涉及了将文本数据化,并以“tf-idf=tf•(N/df)”进行算法的设定,最后依赖于计算机对算法的执行。“tf-idf”是信息检索和数据分析的经典公式,tf 是词频(Term Frequency,缩写为tf),“idf”是“逆文档频率”(Inverse Document Frequency,缩写为idf)。该公式的计算结果数值越大,这个词在文本中的重要性会越高。拉塞姆分别对《浪潮》中的路易斯、本纳德、金妮等角色的词频进行计算,并结合数据阐释了主要人物的性格爱好等。一般来说,该公式的计算结果也需要研究者进一步阐释,这也代表着数据由“生”到“熟”的阶段。由此为例,这个过程清晰地呈现出批评过程的算法化和批评职责的分裂。

3.批评结果的可视化。算法的输出结果往往依托于可视化系统呈现,即批评的可视化。可视化指的是将数据转换成可见的“形象”或“图形”,既包含文本相关“形象”的多维建立,也更偏重经计算后以“图形”呈现数据。图形、图像和文本三者构成批评实践的结果。如“数字亚述学”研究重点在于,以楔形文字为母本材料进行数字化建模,对巴比伦等遗址进行3D 全景重现和虚拟VR 应用。这一过程“不仅表现为对母本意义的遴选与重组,甚至是一种基于母本之上的颠覆性重构,图像创作者掌控着颇为强势的主观能动性”②张伟:《视觉批评何以可能——图像时代文学阐释的视觉转向与审美创构》,《河南社会科学》2017 年第3 期。,即是一种阐释。“图形”呈现文本数据的含义是对单一或多个文学元素进行计算后,再以“图形”来呈现,计算结果的表现形式往往是聚类树状图、生命线、同心圆、矩阵、地图等形式。如中国历代人物传记资料库(CBDB)与中国历史地理信息系统(CHGIS)关联建立立体图景,实现了空间信息可视化。阐释结果的可视化包含着两层含义:第一层是图像与图形已然是一种批评结果的可视化。第二层含义是图形、图像需要经批评者的进一步甄别与解释形成阐释结果。

(二)传统批评与算法批评的核心分歧

由批评媒介的数据化、批评实践的算法化和批评结果的可视化可看出传统批评方法和算法批评之间确实存在较大不同,而二者的核心区别在于文本“典型”塑造的路径以及定性与定量研究的分歧。以“作家”为中心的经典批评方法,以“社会”为中心的文化研究等,分别在方法层面体现出作家、社会历史、文化研究的理论意识前置性,以及与文本之间定性因果律下“典型”的判断。以“文本”为中心的新批评、结构主义等研究方法专注于文学文本自身的语言和结构。但在二元对立、人物功能、故事情节的提炼等又渗透着“重视抽象,轻视数据”的实证研究特点,具体表现在它更加“强调结构是一个被遮掩的,然而确实成型的更深的层面”③[澳]安德鲁•米尔纳、[澳]杰夫•布劳伊特:《当代文化理论》,刘超、肖雄译,南京:江苏人民出版社,2008 年,第90 页。,但在实际操作时往往越过文本自身的量性和结构关系。以“读者”为中心的读者反应批评中,对文本的阐释是基于个人的前经验对文本进行体验性理解,是个体围绕自身的情况与文本之间的互动过程。文本自身的事实居于次要地位,以文本形成体验的真实和共情式的“典型”居于主要地位。综合现有的批评方法,均“强调以自然的、非参与和参与性的观察为手段,注重对研究对象的过程和整体进行具有丰富性、生动性、深层性的描述,并在此基础上进行想象、移情”①沃野:《关于社会科学定量、定性研究的三个相关问题》,《学术研究》2005 年第4 期。,再以不同侧重点对典型进行提炼和研究。算法批评则是基于“大数定律”下的定量研究方式。在研究文本内容时,它主张对某一目标词进行频率的计算,以词频反应小说中的人物意识、身份、关系网络,并以此来建立“概率性”典型。两种树立文本典型的路径各有不同,其结果便存在一定区隔。正如以不同视角对《浪潮》的解读包括女性主义、女性意识、意识流等结果,而拉塞姆通过算法得出的结论则是:“许多人注意到路易痴迷于埃及和尼罗河”②Simens,R.&Schreibman,S.(Ed.).(2013) .A Companion to Digital Studies.New Jersey: Wiley-Blackwell.,言谈中不断提及“西方”,反映出他的民族意识。

定量和定性之别包含着二者对彼此方法论不足的指摘。传统批评方法者普遍认为,要基于文本的体验寻求字面背后意义的“有没有”,指责文学的定量研究根本问题就在于对“有”的基本假设。这也是对意义所进行的先验假设,好像意义只等待数据来揭示。而定量研究则相信通过数据即可以观察到文本中的固有规律以及背后代表的意义。它也批判传统研究方法,容易因为文本互动而产生过量的个人情感与审美意识,滑向阐释个人主义。正如伊格尔顿尖锐地指出了传统批评方法在论据方面的不足:“过于关心概念而很少关心坚实的论据,因此它在非常脆弱的基础上建立起它的不稳定、头重脚轻的知识系统”③[英]特里•伊格尔顿:《现象学、阐释学、接受理论》,王逢振译,南京:江苏教育出版社,2006 年,第54—55 页。,忽视了文本本身就可以确定的东西。实际上,在人文研究传统内,两方的指摘自古有之。其一是源于经验哲学家亚里士多德对经验事例和辨别细微区别的研究传统,后经孔德、实证主义、罗素的语言分析等一脉的发扬。这一派别的阐释传统坚定“任何有价值的哲学都必定是严格科学性的”④[爱尔兰]德尔默•莫兰:《现象学:一部历史的和批评的导论》,李幼蒸译,北京:中国人民大学出版社,2017 年,第27 页。,阐释的结果具有理性。第二股力量是阐释的主观主义。阐释的主观主义指的是对研究对象进行具体视角下的诠释,强调文本的个人体验,而体验的结果与阐释者的主观心境、视域等密切相关。二者呈现出客观和主观两股阐释力量的纠缠,也是对阐释的绝对理性和绝对自由的追求。

而以上分歧的底层逻辑切合了历史上对语言本身“明晰性”认知的争论。此番争论由来已久:语言学领域有索绪尔提出的语言的任意性,乔姆斯基的表层结构与深层结构,哲学领域有语言学转向,“语言说人”中暗藏的文化支配性,再到不同学者对基于话语形成历史阐释问题的争辩,都是围绕着语言展开的。格林布拉特以历史的文本化为论点也提出:“方法论的自觉意识是新历史主义在文化研究中反对另一种历史主义的特殊标志,这种历史主义以对符号以及解释程序的透明性信任为基础。”⑤Greenblatt,S.(1990).Learning to Curse: Essays in Early Modern Culture,London: Routledge.一方面,算法批评程序的建立大部分是基于各种语言模型上实现的,如深度学习语言模型。它依赖于语言的此在,对语言出现的频率进行计算。语言之间的逻辑联系是先于经验而存在的,并可以通过语言频次总结出理论命题。因此,意义在语言中、意义也在语言出现的频率中,这凸显了对语言所指功能、语言明晰性、整体语言系统共享性的信任,也代表对大数据规律的信任。另一方面,传统批评方法承认文本也存在语言的表象规律,但不是自然科学领域的大数法则,而是一种类似休谟式的因果关系(Humean Causation),其含义是“两个事件之间的因果关系仅仅在于第一个事件总是伴随着第二类事件”⑥Beebee,H.(2006).Hume On Causation.London and New York: Routledge.。在文本空间中,休谟因果观指批评者在对某些观念和意象觉察时,一般将知觉下的第一个因素称为原因,把后出现的称为结果;在批评的过程中,则指批评者多以作者、社会文化、自身经验为因,文本创作为果,以此类逻辑来验证文学命题。更重要的是,文学批评经历了后现代主义、哲学的语言学转向等,传统批评家们都对语言的任意性达成了基本的共识,对语言的明晰性持保留意见。他们相信文学性语言不依赖语言的此在,不用对语言本身进行过多关注,而是关注语言自身能指与所指的延异、语言与语气之间的反讽张力、语言与行为之间的断裂、语言的空指造成的“模糊性”等。传统批评家们大多也擅长解读语言背后的象征、隐喻和留白。总体来说,算法批评对语言达意和文本意义澄明性有着基本的信任。而传统批评者多以“逻辑因果”观,将批评者、作家、社会文化等纳入与文本的间性关系中,倡导文本的意义是在批评者与文本之间的互动中生产出来的,语言是间性和交往关系的中介,而非意义本身。

三、定量批评与定性批评的融合

以上的分歧显示出科学主义与人文研究之间看似坚实的壁垒,正如希利斯•米勒(Hillis Miller)在其《现代性、后现代性与新技术制度》中提及当下各学科的研究都依赖于“相对严格的壁垒,边界和高墙”①[美]希利斯•米勒:《现代性、后现代性与新技术制度》,陈永国译,《文艺研究》2000 年第5 期。。但是壁垒也会导致伊格尔顿(Terry Eagleton)所描述的“科学似乎已经缩成以一种枯燥的实证主义与另一方面站不住脚的主观主义之间发生了分裂”②[英]特里 •伊格尔顿:《现象学、阐释学、接受理论:当代西方文艺理论》,王逢振译,南京:江苏教育出版社,2006 年,第 53 页。。因此,破墙之锤是融合的开端,在后续的研究中还需要以跨学科的范式和态度进行研究。但跨学科并不如布拉格学派的穆卡洛夫斯基(J.Mukarovsky)所认为文学的纯然性形成了与社会诸多元素的天然屏障,只能将定性和定量研究机械地放置于文学批评辩证法的两端。而应以文学批评的饱满性、复杂性和多维性为目标,将批评的实践和标准的建构反复地放在不同系统中加以应用和评估,如库恩(Thomas Kuhn)对范式形成的论证一般,将文学批评的本质论变成持续的建构论,以形成整体的、扬弃的批评史观。因此,二者会从浅表性接触过度到深度的融合,以期在今后的发展中形成“定性—定量”共同体的批评成长模式,形成“质感—信度”并存的批评标准。

(一)文学批评“定性—定量”的现阶段融合

定性—定量融合的现阶段批评实践包括以下较为成熟的方面:(1)作者身份研究。基于作家基本的文化面貌和较为稳定的写作特点,可以通过算法对作家常用词汇的频次及其分布进行分析,以确定其身份。如利用计算机人工智能中的支持向量技术,以44 个文言虚字频率为特征向量对《红楼梦》的作者身份进行分析,“结果证明,从第81 回开始的后40 回和前80 回在写作风格上存在明显差别,从技术的角度确认了《红楼梦》前80 回和后40 回为两人所作”③施建军:《基于支持向量机技术的〈红楼梦〉作者研究》,《红楼梦学刊》2011 年第5 期。。(2)人物意识研究。不同的词频可以确定文本人物性别意识、种族意识和共同体意识。如麦克尔•斯特布斯(Micheal Stubbs)对康拉德的《黑暗之心》进行定量分析,通过词语分布研究、文本结构搭建、互文关系“为文学阐释提供更加细节性描述”④Stubbs,M.(2005).Conrad in the Computer: Examples of Quantitative Stylistic Methods.Language and Literature,14,5-24.,总结分析马洛叙事不可靠性下的种族偏见。(3)空间研究。基于作品中出现的地点,对文本空间所有的地理数据进行挖掘计算,可以较为精准地绘制出文本地理空间。如一批学者试图以克里斯托弗•哥伦布、雅克•卡地亚圣劳伦斯海湾的旅程记录、约翰•史密斯于1612 年绘制的弗吉尼亚地图等建立可搜索的数据库,以“差异化制图”的方式建构并还原原住民的生存空间,进一步研究其心理呈现与文化表征。其他领域的学者也在进行语言学与文学的结合研究,如麦克•布克(Michael Burke)希望通过回到文学的结构主义中汲取理论资源再进行更符合文学研究需要的语料库建设。如2003 年在兰卡斯特大学召开的“比喻性语言基于语料库的研究方法”(corpus-based approaches to figurative language),将文学语言的模糊性特点与读者心理反应纳入语料库和可视化系统研发的重点。

在以上若干“定性—定量”融合的研究现状中可见:一方面,部分文学研究者对批评方法“质”“量”的结合已然从认知—接受进入到应用阶段,为获得阐释的公共性和理性,他们愿意让渡部分的阐释主导权力给计算机的算法,接受以实证数据验证自己的阐释结果,进一步规定自己的阐释路径。而语言学的研究者也已经注意到文学性语言与日常语言在传情达意方面的区别,试图在语料库的建设中寻求解决文学的无序、偶然和主观的办法。另一方面,当下大部分的融合仍然未能破除思维定势。如在文学批评意识中,一部分学者仍然将定性等于主观的无序,将定量等于客观的有序,忽视二者辩证共在的状态。在批评方法运用中,局限在以数据“尽可能减少分析和解释中的任意性和循环性”①O’Halloran,K.(2007).The Subconscious in James Joyce’s Eveline’: A Corpus Stylistic Analysis That Chews on the Fish hook’.Language and Literature 16,227-244.,以语言的确定性验证阐释的确定性。但是未来的融合方向是打破既定思维,以共同体的成长模式实现认识论和方法论上的转变。

(二)文学批评“定性—定量”的共同体成长模式

“世界上科学发展的总趋势是走向综合与交叉。走向一体化,不再区分自然科学方法论与社会科学方法论。”②樊柯:《科学主义与20 世纪中国文学史写作研讨会综述》,《文学批评》2005 年第2 期。传统批评与算法批评之间的融合也是二者不断凝视对方,又在被凝视中回看自身,在实践中共同发生了转向性、价值性、颠覆性的变化,形成文学批评方法论层面“系统关系体”的共在状态。

“耗散结构理论”对未来文学批评“定性—定量”融合研究的启示。如果研究者基本承认算法批评和传统批评之间本就具有截然不同的属性,质性研究的文学批评多是主观的、情感的、模糊的、偶然的,量化处理的算法批评是客观的、规律的、确定的和结构的,那么“耗散结构理论”会对必然与偶然的关系形成颠覆。它是伊•普里戈金(I.Prigogine)在其《从混沌到有序》(Order Out of Chaos)中提出的观念,主张“偶然的必然性”和“必然的偶然性”辩证关系。(1)书中列举了“化学钟”的实验和DNA 复制。“化学钟”实验是海量的黑球和白球混合在箱子里乱跳,观察者通过孔洞观察箱子应该是符合可视窗口样本分布,预测出现的球或是白或是黑。但是实际上,白球和黑球的显现随着时间规律地、交替地出现。这是从无序到自显的有序。而在遗传学研究中DNA 进行生物信息复制时,外界的微小干扰可能导致DNA复制时发生巨大的结构性破坏。这是从有序到自显的无序。(2)基于若干类似的观察,普里戈金认为任何系统都有两个走向:有序的系统不会永远延续其定势,而是会进入新的混沌与无序。无序的系统不会永远保持其乱势,它会跃迁到新的有序高阶阶段,即其所说的“耗散结构”。整体的过程体现了:低层次的混沌会形成高层次的有序,有序则会因变量的出现散落为新的无序,形成偶然中走向必然,必然中走向偶然的一体化进程。阿尔文•托勒夫认为普里戈金的研究价值是把“必然性和偶然性重新装到一起,把自然科学和人文科学重新装到一起”③[比]伊•普里戈金、[比]伊•斯唐热:《从混沌到有序:人与自然的新对话》,曾庆宏、沈晓峰译,上海:上海译文出版社,2005 年,第1 页。。

再以耗散结构回看文学批评的定量和定性之别,以及二者融合的问题。其一,文学的定性研究不再等于主观的差异性,它也会逐渐造成阐释的固步自封。在西方精细化发展的批评历史中,如精神分析对人物心理的力比多还原、性别研究中的二元对立性别结构等,均是一种被经验构造并加以抽象的批评模式,它在具体视角的观点中被进一步先验,又循环地前置成批评者的范式居于意识之中。当批评者本来混沌的文本体验被固定的批评范式强制聚焦,寻找的文本证据都会向聚焦的视角靠拢,进而陷入自我封闭的阐释循环之中。这一封闭的状态需要引进大数据的变量来激发其阐释的活力。定量研究不再等同于有序的确定性,算法也会造成阐释的混乱。正如斯坦利•费什(Stanley Fish)在《数字人文及其不朽》中对经数据计算后的“过程性文本”的批判性反思,他认为数字化计算后的文本像《失乐园》中的神秘舞蹈,逐级递增的数据增加了阐释的噪音,在某种程度上并没有起到聚合阐释的作用而是加深了分歧。因此,在阐释的混乱中需要为数字锚定具体的人文价值。斯科李莫夫斯基(H.Skolimowski)也认为:“任何现代技术文明的人文化尝试,首先都会把人类的价值观贯彻其中”④[俄]B.M.罗津:《技术哲学——从埃及金字塔到虚拟现实》,张艺芳译,上海:上海科技教育出版社,2018 年,第6 页。,实际也应该贯彻其中。其二,普里戈金的耗散结构理论明确地把系统的“必—偶”运动归结为自发性生成,它“是一个‘自组织’的过程,真的从无序和混沌中‘自发地’产生出来”①[比]伊•普里戈金、[比]伊•斯唐热:《从混沌到有序:人与自然的新对话》,第6 页。。但文学批评的实践不能依靠自发变化,或者它表现为自发的运动,实际上也是人的主导实践在宏观层面被观测为自发无意识进程。综合以上两个方面,具体的融合实践路径,就不是从方法论共时天平的两端,择其一而用。而是让主观的文学判断融合实证意识,让数字技术研究贯穿人文价值,抑或主动地在定量中引入变量,在变量中把握定量,在历时性批评实践中保证有序与无序的并存和转化,以形成文学批评共同体的成长模式。它会成为对文学“原生式的把握,不是线性的,而是非线性的;不是决定论的,也不是纯粹偶然论的,而是有序与无序的统一,偶然与必然的统一。随机中有着有序,有序中又有着随机;无序中孕育着有序,有序复分为随机”②王钟陵:《论文学史运动的内在机制及其展开形式》,《中国社会科学》1995 年第5 期。。

最后,共同体成长的文学批评可能更加切合拉塞姆说所的“认识论转变”,“‘算法批评’拒绝将计算机的经验主义观点视为可以验证批判性解释的一种手段,而是寻求将计算过程定位在丰富的传统或解释性努力中(相较于批评,它通常与艺术更一致),这种寻求不限制意义,而是保证其多样性”③Simens,R.&Schreibman,S.(Ed.).(2013) .A Companion to Digital Studies.New Jersey: Wiley-Blackwell.,形成“质感—信度”并存的批评标准。

综上所述,从印刷业到互联网行业、书籍到数据库,正如波兹曼曾对媒介更迭进行评论:“一种重要新媒介会改变话语的结构”④[美]尼尔•波兹曼:《娱乐至死》,章艳译,桂林:广西师范大学出版社,2004 年,第33 页。。而文学作为人文研究的子部分,同样受到了大数据下算法的拨弄。这种拨弄是否会成为一股强大的力量并与传统批评方法形成融合之势,研究者确有积极的预测。算法批评对“人文的科学化、科学的人文化”趋势更加敏感并进行积极回应。它代表了定量和定性的融合,有打破阐释的封闭性,又使其获得一定秩序性的潜力。算法批评研究不仅仅局限于发挥其实证作用,最终目的更不是打破文学的中心性,而是共生于传统批评方法之中,助力形成更加具有“质量”的批评成果。

猜你喜欢
文学批评文本算法
文学批评新生代
倡导一种生命理想——论谢有顺的文学批评及其文学批评观
基于MapReduce的改进Eclat算法
在808DA上文本显示的改善
Travellng thg World Full—time for Rree
进位加法的两种算法
基于doc2vec和TF-IDF的相似文本识别
马克思主义文学批评:自成体系的文学批评
回族文学批评的审视与反思——以石舒清《清水里的刀子》文学批评为例
一种改进的整周模糊度去相关算法