论“数据挖掘”技术在中国文学研究中的应用
——以《文心雕龙》的研究为例

2021-12-31 14:06赵耀锋
宁夏师范学院学报 2021年2期
关键词:文心雕龙文学理论刘勰

赵耀锋

(宁夏师范学院 文学院, 宁夏 固原 756099)

“数据挖掘”技术是通过关键词检索形成数据链,然后对这些数据链进行科学分析得出研究结论。“数据挖掘”技术在中国文学研究中的应用有两个条件:一是必须具备一定的文学文献数据库,一是研究者必须熟悉“数据挖掘”技术。这种数据库一方面可以通过国家各种文献平台的有偿服务来获取,另一方面可以通过研究者自己来建构。通过这种“数据挖掘”技术对中国文学的研究,可以形成人文学科研究中的科学性和系统性。

科学性是经典文学史形成的必要前提和基础,科学性是现代文学研究和传统文学研究的区别之所在。现代学术史上曾经产生许多文学史名著,但是这些名著又都在文学史的长河中被淡出了,主要的原因就是随着文学研究科学性质素的不断增强,后出的文学史科学性的含量不断提升,前代的文学史不断被取代。从这个层面上讲,“数据挖掘”技术在中国文学研究中的重要性将会不断得到提升。

通过“数据挖掘”技术对《文心雕龙》展开研究,在具体操作层面是通过文心、文心雕龙、龙学、刘勰、刘彦和这几个关键词的检索来进行的。这种研究方法曾经有过经典例证。例如,罗宗强在研究《文心雕龙》时曾经运用过类似的方法,他评《文心雕龙》曰:“在创作论中他引用《庄子》15次……有的是引用其术语,有的是直接用其文句,有的虽引其文句而改变其用法,有的则是引其思想而以己之言语表达。”[1]罗宗强先生还对《文心雕龙》论及的作家、作品、文本的数量进行了统计,认为《文心雕龙》一书论及先秦至南朝齐梁的几乎所有作者322人,引及作品436篇、部,引用原文223处[1]。罗宗强先生还对《文心雕龙》论及的中国文化史形成期的重要思想家进行了统计,他说:“从他所提及的作者以及对于他们的评论,我们可以看出他兼容并包的治学倾向。他提到儒家的孔子、孟子、子贡、子夏、子思、荀子……提到史家司马迁、班固、刘向、刘歆、孙盛、干宝等等;甚至还提及兵家的孙武。各个学科,各个学派,他都接触到了。”[1]这种研究方法在当代其他研究者的论著中也有广泛的应用,例如,张少康先生对《文心雕龙》论及的文体数量进行过统计,他认为《文心雕龙》论及74种文体。[2]不过,上述研究都是简单的数量统计,基本上都是凭借普泛的阅读统计方式进行的,尚未应用严格意义上的以计算机统计为基础的“数据挖掘”技术,但是,这种研究方法体现了现代学术史上运用“数据挖掘”技术研究中国文学学术思想的萌芽。笔者应用“数据挖掘”技术研究中国文学的研究方法实际上受到了罗宗强先生《文心雕龙》研究方法的启示。

一、“数据挖掘”技术与文学经典性研究

文学研究中的“数据挖掘”技术,就是在相关的数据库中通过关键词检索形成统计数据,通过对统计数据的分析形成研究结论。例如,关于学术界对《文心雕龙》文学经典性认识形成时代的研究,具体的操作方法是在《四库全书》电子数据库中通过对上述关键词,特别是“文心雕龙”和“刘勰”等关键词的检索,得到的数据中在文献学意义上时代最早的文献是南朝梁沈约所撰《梁书·刘勰传》,其称:“约便命取读,大重之,谓为深得文理,常陈诸几案。”[3](P712)由此可见,《文心雕龙》在其产生的当代便成为文学经典。关于学术界对《文心雕龙》文学经典性认识被强化的时代,在数据库中得到宋代的几条文献材料:宋代孙光宪在《白莲集序》中曰:“风雅之道,孔圣之删备矣;美刺之说,卜商之序明矣。降自屈宋,逮乎齐梁,穷诗源流,权衡辞义,曲尽商榷,则成格言,其惟刘氏之文心乎!”[4](P645)宋代黄庭坚在《山谷尺牍与王立之》中曰:“刘勰文心雕龙,刘子玄史通,此两书曾读否?所论虽未极高,然讥弹古人,大中文病,不可不知也。”[4](P645)可见,到了宋代,文学理论界已经普遍形成一种认识:《文心雕龙》是一部文学理论经典。关于学术界对于《文心雕龙》文学经典性认识成为“文学常识”的时代,在数据库中得到一条文献材料:清代章学诚在论及唐前文学理论著作时曰:“《诗品》之于论诗,视《文心雕龙》之于论文,皆专门名家,勒为成书之初祖也。”[5](P559)可见,到了清代,“《文心雕龙》是一部文学理论经典”已经成为文学常识。关于学术界对于《文心雕龙》文学经典性认识在当代的接受情况,在数据库中得到以下几条文献材料:鲁迅先生在《诗论题记》一文中评《文心雕龙》曰:“篇章既富,评骘自生,东则有刘彦和之《文心》,西则有亚理士多德之《诗学》,解释神质,包举洪纤,开源导流,为世楷式”[6](P332)杨明照评《文心雕龙》曰:“是刘勰惨淡经营的巨大成果,也是我国文学批评史上巍然屹立的高峰”[7](P6),曹顺庆认为:“《诗学》《文心雕龙》和印度的《舞论》,鼎足而立,为世界三大文论支柱。”[8](P142-143)由以上几条材料可见学术界对于《文心雕龙》文学经典性认识被当代重新体认。关于学术界对《文心雕龙》文学经典性认识形成背景之研究,也可以通过“数据挖掘”技术来实现。《文心雕龙》作为一部文学理论著作,该书是通过对大量文学作品的阅读来建构的,因此,大量文集的出现应该是《文心雕龙》写作的前提。因此,以“集部”“别集”为关键词,分析“集部”一词出现的最早时期,从而分析《文心雕龙》的产生与文集流行之间的关系。在关键词检索所得到的集部文献数据链中,章学诚认为:“集部著录,实仿于萧梁,而古学源流,至此为一变。”[5](P297)可见,《文心雕龙》一书的形成与集部文献的出现息息相关。中古时代是一个新旧学术交融变动的时代,新的文学观念及理论的形成是《文心雕龙》文学经典性的具体表现,因此,以“文章”为关键词,了解刘勰的文学观念便成为研究的核心问题。通过检索得到一条文献,萧子显《南齐书·文学传》中曰:“文章者,盖情性之风标,神明之律吕也。”[9](P907)萧纲在写给儿子的书信《诫当阳公大心书》中曰:“立身之道,与文章异,立身先须谨重,文章且须放荡。”萧绎《金楼子·立言》中曰:“至如文者,惟须绮縠纷披,宫徵靡曼,唇吻遒会,情灵摇荡。”[10](P264)可见,把情感表达作为文学作品区别于应用性文体,这是当时文学观念自觉的标志。

以上关于《文心雕龙》文学经典性的研究结论之得出,都是通过“数据挖掘”技术,以相关数据库的文献材料作为依据的,因而所得出的结论比较科学,可信度较强。这些结论是建构科学和系统性文学史的前提和基础。

二、“数据挖掘”技术与新的文学解释视域的形成

如前所揭,在分析《文心雕龙》文学经典性形成的文学背景时,以“别集”“文章”“文体”为关键检索词,意欲了解齐梁文人对于上述文学观念的理解。在以“别集”为检索词时,得到了以下文献:章学诚《文史通义·诗教下》曰:“集文虽始于建安,(魏文撰徐、陈、应、刘文为一集,此文集之始,挚虞《流别集》,犹其后也。)而实盛于齐、梁之际;古学之不可复,盖至齐梁而后荡然矣。(挚虞《流别集》,乃是后人集前人。人自为集,自齐之《王文宪集》始而昭明《文选》又为总集之盛矣。)”[5](P80)这条文献对齐梁时期文章别集的盛行情况进行了系统分析。在检索中,没有得到齐梁时期具体论述“别集”的文献,但却意外地发现了“流别集”这样一部文集的名称,意外地得到了相关联的信息。在以“文章”、“文体”为检索词时,得到了两条相关文献:《南齐书·文学传》曰:“文章者,盖情性之风标……若子桓之品藻人才,仲治之区判文体,陆机辨于《文赋》,李充论于《翰林》,张视摘句褒贬,颜延图写情兴,各任怀抱,共为权衡。”[9](P907)钟嵘《诗品》曰:“陆机《文赋》通而无贬;李充《翰林》,疏而不切;王微《鸿宝》,密而无裁;颜延论文,精而难晓;挚虞《文志》详而博赡,颇曰知言:观斯数家,皆就谈文体,而不显优劣。”[11](P4)这两条文献均与文学观念无关,但是从这两条文献记载可以看出当时批评著作之繁盛。文人文集的产生、文学批评著作的大量产生,正是《文心雕龙》得以产生的最主要的两个因素。可见,运用“数据挖掘”技术研究中国文学,可以形成新的文学解释视域。

三、“数据挖掘”技术与科学文学思想史建构

文学思想史的科学性和系统性是文学思想研究现代性的核心因素,笔者在《文心雕龙研究》一书中对此问题进行过阐释:“文学史就是文学,从这个命题可以推演出一个大前提和一个小前提,大前提可以理解为‘文学是科学的,或者说,文学也是科学’,小前提可以理解为‘文学史本身就是科学的,因为揭示文学史的内容就属于科学的范畴’,把这两个方面联系起来,可以说,文学作为一门人文学科,它有一定的科学性,只有在强调文学的诗性精神的同时重视文学的科学性,才能既以参与者又以旁观者的视角对文学问题进行客观的体认,这也是文学研究能够具有终极意义的保证。”[12](P44)科学性和系统性在文学史书写过程中的重要性越来越被彰显,同时,科学性和系统性也是评价一部文学史的学术价值的最为重要的因素,而文学史的科学性对数据挖掘技术的依赖性越来越被强化。

传统的文学思想史建构往往通过对经典文学理论术语的美学阐述来建构的,这种建构文学思想史的方法有其优缺点,优点是杰出的批评家往往能对具体文学理论范畴进行经典阐释,缺点是往往会出现过渡阐释的现象,这种过渡阐释是传统文学批评的主要症结之所在。通过“数据挖掘”技术对经典文学理论术语进行统计分析,从而理清文学理论术语产生的背景及其具体的美学内涵,在此基础上建立科学的文学理论阐释学。

笔者曾经运用数据挖掘技术对《文心雕龙》中有关文学制度的术语出现的次数进行了统计,统计从两个维度进行:第一个维度是对《文心雕龙》中表示文学制度的名词性术语的统计,检索关键词分别是恒裁、恒数、恒、自然之道、自然、检、理、道、要、文之司南、权衡、常、方、枢机、文理、神理、模、道心、裁、节、权、规矩、绳墨、斧斤、序、数、极、准、术、统序、权衡、规等。上述检索关键词是对这些术语表示“文学创作的原理、规律”意义时的统计。第二个维度是对《文心雕龙》中表示文学规范操作的动词性术语的统计,检索关键词分别是检、循、规、规范、规矩、方、裁、权衡、驭、绳、节文等。上述检索关键词是对这些术语表示“运用文学创作的原理、规律指导文学创作、批评”意义时的统计。

从第一个维度的统计结果可以发现:表述文学理论的核心专业术语的高频率出现表明其时文学理论已经形成完整的系统,并且趋于规范化。从第二个维度的统计结果可以发现:表述文学制度规范的操作性专业术语大量出现,而且表述文学理论规范的操作性核心专业术语出现的频率非常高。上述两个方面表明:刘勰是以科学的方法进行文学理论研究的,同时,《文心雕龙》中的文学理论范畴具有规范性,是从当时通行的文学理论术语中提炼出来的。可见,运用科学“数据挖掘”技术,可以论证一部文学理论著作在文学理论思想史上是否具有科学性。

四、“数据挖掘”技术与溯源式研究范式的确立

中国传统学术史的基本写作范式是考证源流,在文学理论研究中这种方法更显得重要,因为文学思想史的研究就是要探究一种理论发展流变之线索。通过“数据挖掘”技术,可以对《文心雕龙》重要的文学理论范畴进行理论渊源考证,从而更加准确的阐释《文心雕龙》文学理论的内涵,也可以更为系统的解释《文心雕龙》理论产生的理论渊源。

以“源”为关键检索词,得到许多《文心雕龙》文本中的材料,其中一些材料是表明其研究方法的。如《序志》篇曰:“并未能振叶以寻根,观澜而溯源。”刘勰对其文论先辈颇有微词,原因主要就在于刘勰不满于他之前的文论家们不能像他一样来作“振叶寻根”、“原始要终`”的溯源式文学理论研究。刘勰也对自己的溯源式研究范式反复进行强调。《知音》篇曰:“夫缀文者情动而辞发,观文者披文以入情 ,沿波讨源,虽幽必显。”《体性》篇曰:“沿根讨叶,思转自圆。”溯源式研究范式是《文心雕龙》文学理论经典形成的方法论前提。

另一些文献材料揭示了刘勰具体的溯源式研究方法。《诠赋》篇曰:“讨其源流,信兴楚而盛汉矣。”《宗经》篇曰:“故论说辞序,则《易》统其首;诏策章奏,则《书》发其源;赋颂歌赞,则《诗》立其本;铭诔箴祝,则《礼》总其端;记传盟檄,则《春秋》为根:并穷高以树表,极远以启疆,所以百家腾跃,终入环内者也。”《序志》篇曰:“唯文章之用,实经典枝条,五礼资之以成文,六典因之致用,君臣所以炳焕,军国所以昭明,详其本源,莫非经典。”《诠赋》篇曰:“汉初词人,顺流而作。陆贾扣其端,贾谊振其绪,枚马播其风,王扬骋其势,皋朔已下,品物毕图。繁积于宣时,校阅于成世,进御之赋,千有余首,讨其源流,信兴楚而盛汉矣。”刘勰运用溯源式研究方法对各种文体起源进行了文献考察。溯源式研究方式是《文心雕龙》成为经典文学理论著作的主要原因。而这个结论的得出,又是以溯源式研究方法,运用“数据挖掘”技术,通过关键词检索,然后对检索得到的文献进行分析得出的结论。由此可见,“数据挖掘”技术是溯源式研究范式建立的现代技术支撑。

由此可见,“数据挖掘”技术在中国文学研究中有着广泛的运用,“数据挖掘”技术是文学经典性研究及科学与系统的文学思想史建构的前提和基础,“数据挖掘”技术也是中国文学研究中溯源式研究范式确立的技术支撑,“数据挖掘”技术可以形成新的文学解释视域。总而言之,“数据挖掘”技术有助于人文学科研究中的系统性与科学性质素的提升。

猜你喜欢
文心雕龙文学理论刘勰
舍弃面子的刘勰
刘勰“文以明道”中的情志主体论
《中国文论通史》
舍弃面子的刘勰
社会转型期中国文学理论创新研究
新媒体时代文学理论教学研究
《文心雕龙》选读
《文心雕龙》:中国第一部系统的文艺理论巨著
文心流韵·千古回眸——刘勰和文心雕龙
文学理论:在中国特色的道路上